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Beschreibung 

[0001] Die Erfindung betriffi insbesondere NuWeinsSuren, die fur Acetylcholinrezeptor-Untereinheiten von Insekten 
kodieren. 

[0002] Nikotinische Acetylcholinrezeptoren sind ligandengesteuerte lonenkanaie, die eine Rolle bei der Neurotrans- 
mission im Tierreich spielen. Die Bindung von Acetylcholin Oder anderen Agonisten an den Rezeptor verursacht eine 
vorubergehende Offnung des Kanals und gestattet den Durchstrom von Kationen. Man nimmt an, daB ein Rezeptor aus 
funf Untereinheiten besteht, die sich urn eine Pore gruppieren. Jede dieser Untereinheiten ist ein Protein das aus 
einem extrazelluiaren N-terminalen Teil besteht, gefolgt von drei Transmembranregionen, einem intrazellul'aren Teil t 
sowie einer vierten Transmembranregion und einem kurzen extrazelluiaren C-terminalen Teil (Changeux et al. 1992) 
[0003] Acetylcholinrezeptoren sind vor allem in Wirbeltieren gut untersucht. Anhand ihrer anatomischen Lokalisierung 
und ihrer funktionellen Eigenschaften (Leitungseigenschaften des Kanals, Desensibilisierung, Sensitivitat gegenuber 
Agonisten und Antagonisten, sowie gegenuber Toxinen wie z.B. a-Bungarotoxin) lassen sich hier drei Qruppen unter- 
scheiden. Die Einteilung korreliert mit der molekularen Zusammensetzung der Rezeptoren. Es gibt heterooligomere 
Rezeptoren mit der Untereinheitenzusammensetzung 02^6. die im Muskel vorkommen (Noda et al. 1982 Claudio et 
al. 1983, Devillers-Thiery et al. 1983, Noda et al. 1983a, b), heterooligomere Rezeptoren, die Untereinheiten aus der 
Gruppe o2 - a6 und p2 - p4 enthalten, und die im Nervensystem vorkommen (Wada et al. 1 988, Schoepfer et al. 1 990 
Cockcroft et al. 1991, Heinemann et al. 1997), sowie homooligomere Rezeptoren, die Untereinheiten aus der Gruppe 
a7 - a9 enthalten, und die ebenfalls im Nervensystem vorkommen (Lindstrom et al. 1997, Elgoyhen et al. 1997). Diese 
Einteilung wird auch durch eine Betrachtung der Verwandschaft der Gensequenzen der verschiedenen Untereinheiten 
gestutzt. Typischerweise sind die Sequenzen funktionell homologer Untereinheiten verschiedener Spezies ahnlicher 
als Sequenzen von Untereinheiten aus verschiedenen Gruppen, aber der gleichen Spezies. So weist z.B. die musku- 
ISre a-Untereinheit der Ratte 78 % identische und 84 % ahnliche Aminosauren auf mit der des elektrischen Rochens 
Torpedo californica, aber nur 48 % Identitat und 59 % Ahnlichkeit mit der o2-Untereinheit (heterooligomer, neuronal) 
der Ratte, und 36 % Identitat und 45 % Ahnlichkeit mit der «7-Untereinheit (homooligomer, neuronal) der Ratte. Wei- 
terhin sind die Gensequenzen aller bekannten Acetylcholinrezeptor-Untereinheitenen nicht nur untereinander in gewis- 
sem MaGe ahnlich, sondern auch mit denen einiger anderer ligandengesteuerter lonenkanaie (z.B. den 
Serotoninrezeptoren vom Typ 5HT 3 , den GABA-gesteuerten Chloridkanaien, den Glycin-gesteuerten Chloridkanaien). 
Man geht daher davon aus, daG alle diese Rezeptoren von einem gemeinsamen Voriaufer abstammen und ordnet sie 
in eine Supergenfamilie ein (Ortells et al. 1995). 

[0004] In Insekten ist Acetylcholin der wichtigste exzitatorische Neurotransmitter des zentralen Nervensystems. Dem- 
entsprechend lassen sich Acetylcholinrezeptoren an Praparaten zentraler Ganglien aus Insekten elektrophysiologisch 
nachweisen. Der Nachweis gelingt sowohl an post- als auch an prasynaptischen Nervenendigungen, sowie an den 
ZellkGrpern von Interneuronen, Motorneuronen und modulatorischen Neuronen (Breer et al. 1987, Buckingham et al. 
1997). Unter den Rezeptoren gibt es solche, die durch a-Bungarotoxin inhibiert werden, und solche, die insensitiv sind 
(SchloB et al. 1988). Die Acetylcholinrezeptoren sind auBerdem der molekulare Angriffspunkt wichtiger naturlicher (z.B. 
Nikotin) und synthetischer Insektizide (z.B. Chloronikotinyle). 

[0005] Die Gensequenz einer Anzahl von nikotinischen Acetylcholinrezeptoren der Insekten ist bereits bekannt. So 
sind in Drosophila melanogaster die Sequenzen font verschiedener Untereinheiten beschrieben (Bossy et al. 1988, 
Hermanns-Borgmeyer et al. 1986, Sawruket al. 1990a, 1990b, Schulz et al. unver6ffentlicht t EM BL accession number 
Y15593), in Locusta migratoria ebenfalls funf (Stetzer et al. unverOffentlicht, EMBL accession numbers AJ000390 - 
AJ000393), in Schistocerca gregaria eine (Marshall et al. 1990). in Myzus persicae zwei (Sgard et al. unverOffentlicht, 
EMBL accession number X81887 und X81888), in Manduca sexta eine Sequenz (Eastham et al. 1 997). Zudem ist eine 
Reihe von partiellen Gensequenzen aus Drosophila melanogaster als sog. expressed sequence tags charakterisiert 
worden (Genbank accession numbers AA540687, AA698155, AA697710, AA697326). Die hohe Ahnlichkeit einzelner 
Sequenzen mit solchen aus anderen Insekten legt nahe, da8 es sich bei diesen Untereinheiten urn funktionelle Homo- 
loge handelt. 

[0006] Es ist von groGer praktischer Bedeutung, beispielsweise fur die Suche nach neuen Insektiziden, neue Unter- 
einheiten von Acetylcholinrezeptoren aus Insekten bereitzustellen, wobei besonders solche von Interesse sind, die sich 
von den bekannten starker unterscheiden, als dies zwischen funktionellen Homologen der Fall ist. 
[0007] Der vorliegenden Erfindung liegt somit insbesondere die Aufgabe zugrunde, NuWeinsauren zur Verfugung zu 
stellen, die neue Acetylcholinrezeptor-Untereinheiten von Insekten kodieren. 

[0008] Die Aufgabe wird geldst durch die Bereitstellung von Nuldeinsauren umfassend eine Sequenz ausgewShlt aus 

(a) den Sequenzen gemaB SEQ ID NO: 1, SEQ ID NO: 3 oder SEQ ID NO: 5. 

(b) zumindest 14 Basenpaare langen Teilsequenzen der unter (a) definierten Sequenzen, 
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(c) Sequenzen, welche an die unter (a) definierten Sequenzen hybridisieren in 2 x SSC bei 60°C, bevorzugt in 0,5 
x SSC bei 60°C, besonders bevorzugt in 0,2 x SSC bei 60°C (Sambrook et al. 1989), 

(d) Sequenzen, welche eine zumindest 70 %ige Identitat zu den unter (a) definierten Sequenzen zwischen Position 
1295 und Position 2195 aus SEQ ID NO: 1 Oder zwischen Position 432 und Position 1318 aus SEQ ID NO: 3 Oder 
zwischen Position 154 und Position 1123 aus SEQ ID NO: 5 aufweisen, 

(e) Sequenzen. welche zu den unter (a) definierten Sequenzen komplementar sind und 

(0 Sequenzen, welche aufgrund der Degeneration des genetischen Codes fur dieselbe Aminosauresequenz kodie- 
ren wie die unter (a) bis (d) definierten Sequenzen. 

[0009] Der Grad der Identitat der Nukleinsauresequenzen wird vorzugsweise bestimmt mit Hilfe des Programms GAP 
aus dem Programmpaket GCG, Version 9.1 unter Standardeinstellungen (Devereux et al. 1984). 
[0010] Die vorliegende Erfindung begrOndet sich auf den Qberraschenden Befund, daB Insekten Gene besitzen, die 
fur Untereinheiten von insbesondere homooligomeren Acetylcholinrezeptoren kodieren. 

[001 1 ] Gegenstand der Erfindung sind weiterhin Vektoren, die zumindest eine der erfindungsgemaBen NuWeinsauren 
enthatten. Als Vektoren kOnnen alle in molekularbiologischen Laboratorien verwendete Plasmide, Phasmide, Cosmide, 
YACs Oder kQnstliche Chromosomen verwendet werden. Fur die Expression der erfindungsgemaBen NuWeinsauren 
kOnnen diese mit ublichen regulatorischen Sequenzen verknupft werden. Die Auswahl solcher regulatorischen 
Sequenzen ist davon abhangig, ob zur Expression pro- Oder eukaryotische Zellen bzw. Zellfreie Systeme verwendet 
werden. Besonders bevorzugt als Expressionskontrollsequenz sind z.B. der fruhe Oder spate Promotor des SV40 Oder 
des Adenovirus, des Cytomegalovirus, das lac-System, das trp-System, die Haupt-Operator- und Promotorregionen 
des Phagen lambda, die Kontrollregionen des fd-HOIIproteins. der Promotor der 3-Phosphoglyceratkinase, der Promo- 
tor der Sauren Phosphatase und der Promotor des a-Mating-Faktors der Hefe. 

[0012] Zur Expression der erfindungsgemaBen NuWeinsauren kOnnen diese in geeignete Wirtszellen eingebracht 
werden. Als Wirtszellen eignen sich sowohl prokaryotische Zellen, vorzugsweise E.coli. als auch eukaryotische Zellen, 
vorzugsweise Sauger- Oder Insektenzellen. Weitere Beispiele fur geeignete einzellige Wirtzellen sind: Pseudomonas, 
Bacillus, Streptomyces, Hefen, HEK-293, Schneider S2, CHO-, COS1-, COS7-, Zellen, Pflanzenzellen in Zellkultur 
sowie Amphibienzellen, insbesondere Oocyten. 

[001 3] Gegenstand der vorliegenden Erfindung sind auch die Polypeptide, die von den erfindungsgemaBen NuWein- 
sauren kodiert werden, sowie die daraus aufgebauten Acetylcholinrezeptoren, bevorzugt homooligomere Acetylcholin- 
rezeptoren. 

[0014] Zur Herstellung der Polypeptide, die von den erfindungsgemaBen NuWeinsauren kodiert werden, kOnnen 
Wirtszellen, die zumindest eine der erfindungsgemaBen NuWeinsauren enthalten, unter geeigneten Bedingungen kul- 
tiviert werden. Die gewunschten Polypeptide kOnnen danach auf ubliche Weise aus den Zellen oder dem Kurturmedium 
isoliert werden. 

[001 5] Weiterhin sind AntikOrper Gegenstand der Erfindung, die spezif isch an die vorstehend genannten Polypeptide 
bzw. Rezeptoren binden. Die Herstellung solcher AntikOrper erfolgt auf die ubliche Weise. Beispielsweise kOnnen sol- 
che AntikOrper produziert werden durch die Injektion eines substantieil immunkompetenten Wirts mit einer fur die Anti- 
korperproduktion effektiven Menge eines erfindungsgemaBen Acetylcholinrezeptor-Polypeptids Oder eines Fragments 
davon und durch nachfblgende Gewinnung dieses AntikOrpers. Weiterhin laBt sich in an sich bekannter Weise eine 
immortalisierte Zellinie erharten, die monoklonale AntikOrper produziert Die AntikOrper kOnnen gegebenenfalls mit 
einem Nachweisreagenz markiert sein, Bevorzugte Beispiele fur ein solches Nachweis-Reagenz sind Enzyme, radio- 
aktiv marWerte Elemente, fluoreszierende Chemikalien oder Biotin. Anstelle des vollstandigen AntikOrpers kOnnen 
auch Fragmente eingesetzt werden, die die gewunschten spezifischen Bindungseigenschaften besitzen. 
[0016] Die erfindungsgemaBen NuWeinsauren kdnnen insbesondere zur Herstellung transgener Invertebraten ver- 
wendet werden. Diese kOnnen in Testsysteme eingesetzt werden, die auf einer vom Wildtyp abweichenden Expression 
der erfindungsgemaBen Rezeptoren oder Varianten hiervon basieren. Ferner fallen hierunter sSmtliche transgenen 
Invertebraten, bei denen durch die Modification anderer Gene oder Genkontrollsequenzen (Promotoren) eine Verande- 
rung der Expression der erfindungsgemaBen Rezeptoren oder deren Varianten eintrrtt. 

[001 7] Die Herstellung der transgenen Invertebraten erfolgt beispielsweise in Drosophila melanogaster durch P-Ele- 
ment vermitteften Gentransfer (Hay et al.. 1997) oder in Caenorhabditis elegans durch Transposon vermittelten Gen- 
transfer (z.B. durch Tel. Plasterk. 1996). 

[0018] Gegenstand der Erfindung sind somrt auch transgene Invertebraten, die zumindest eine der erfindungs- 
gemaBen NuWeinsauren enthalten, vorzugsweise transgene Invertebraten der Arten Drosophila melanogaster oder 
Caenorhabditis elegans, sowie deren transgene Nachkommen. Vorzugsweise enthalten die transgenen Invertebraten 
die erfindungsgemaBen Rezeptoren in einer vom Wildtyp abweichenden Form. 
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[001 9] Die erfindungsgemaBen Nukleinsauren kOnnen auf die Qbliche Weise hergestellt werden. Beispielsweise k6n- 
nen die Nukleinsauremolekule vollstandig chemisch synthetisiert werden. Man kann auch nur kurze Stucke der 
erfindungsgemaBen Sequenzen chemisch synthetisieren und solche OiigonukJeotide radioaktiv Oder mit einem Fluo- 
reszenzfarbstoff markieren. Die markierten Oligonukleotide kfinnen verwendet werden, um ausgehend von Insekten- 
mRNA hergeslellte cDNA-Banken zu durchsuchen. Klone, an die die markierten Oligonukleotide hybridisieren ("posi- 
tive Klone"), werden zur Isolierung der betreffenden DNA ausgewahft. Nach der Charakterisierung der isoiierten DNA 
erhait man auf einfache Weise die erfindungsgemaBen Nukleinsauren. 

[0020] Die erfindungsgemaBen Nukfeinsauren kGnnen auch mittels PCR-Verfahren unter Verwendung chemisch syn- 
thetisierter Oligonukleotide hergestellt werden. 

[0021] Die erfindungsgemaBen Nukleinsauren kOnnen zur Isolierung und Charakterisierung der regulatorischen 
Regionen, die naturlicherweise benachbart zu der kodierenden Region vorkommen, verwendet werden. Solche regu- 
latorischen Regionen sind somit ebenfalls Gegenstand der vorliegenden Erf indung. 

[0022] Mit Hilfe der erfindungsgemaBen Nukleinsauren kOnnen neue Wirkstoffe fur den Pflanzenschutz identifiziert 
werden, z.B. Verbindungen, welche als Modulatoren. insbesondere als Agonisten Oder Antagonisten, die Leitungsei- 
genschaften der erfindungsgemaBen Acetylcholinrezeptoren verandern. Dazu wird ein rekombinantes DNA-Molekul, 
das zumindest ein erfindungsgemaBes Nukleinsauremolekul umfaBt, in eine geeignete Wirtszelle eingebracht Die 
Wirtzelle wird in Gegenwart einer Verbindung oder einer Probe, welche eine Vielzahl von Verbindungen umfaBt, unter 
Bedingungen kuttiviert, die die Expression der erfindungsgemaBen Rezeptoren erlauben. Eine Veranderung der 
Rezeptoreigenschaften kann - wie nachstehend in Beispiel 2 beschrieben - detektiert werden. Auf diese Weise ist es 
mdglich, insektizide Substanzen aufzufinden. 

[0023] Die erfindungsgemaBen Nukleinsauren ermdglichen auch das Auffinden von Verbindungen, die an die 
erfindungsgemaBen Rezeptoren binden. Diese kdnnen ebenfalls als Insektizide auf Pflanzen angewandt werden. Bei- 
spielsweise werden Wirtszellen, die die erfindungsgemaBen Nukleinsauren enthalten und die entsprechenden Rezep- 
toren bzw. Polypeptide exprimieren oder die Genprodukte seibst mit einer Verbindung oder einem Gemisch von 
Verbindungen unter Bedingungen in Kontakt gebracht, die die Wechselwirkung zumindest einer Verbindung mit den 
Wirtszellen. den Rezeptoren oder den einzelnen Polypeptiden erlauben. 

[0024] Unter Verwendung von Wirtszellen oder transgenen Invertebraten, die die erfindungsgemaBen Nukleinsauren 
enthalten. ist es auch mOglich. Substanzen aufzufinden. welche die Expression der Rezeptoren verandern. 
[0025] Die vorstehend beschriebenen erfindungsgemaBen Nukleinsauren, Vektoren und regulatorischen Regionen 
kOnnen auBerdem zum Auffinden von Genen verwendet werden, die fur Polypeptide kodieren, welche am Aufbau von 
funktionell ahnlichen Acetylcholinrezeptoren in Insekten beteiligt sind. Unter funktionell ahnlichen Rezeptoren werden 
gemaB der vorliegenden Erfindung Rezeptoren verstanden, die Polypeptide umfassen, welche sich zwar hinsichtlich 
der Aminosauresequenz von den hierin beschriebenen Polypeptiden unterscheiden, aber im wesentlichen dieselben 
Funktionen haben. 

Eriauterunaen zum Seauenzprotokoll und zu den Fiauren: 
[0026] 

SEQ ID NO: 1 zeigt die Nukleotidsequenz der isoiierten Da7 cDNA, beginnend mit Position 1 und endend mit Posi- 
tion 2886. SEQ ID NO: 1 und SEQ ID NO: 2 zeigen ferner die Aminosauresequenzen des von der Da7 cDNA 
Sequenz abgeleiteten Proteins. 

SEQ ID NO: 3 zeigt die Nukleotidsequenz der isoiierten Hva7-1 cDNA, beginnend mit Position 1 und endend mit 
Position 3700. SEQ ID NO: 3 und SEQ ID NO: 4 zeigen ferner die Aminosauresequenzen des von der Hva7-1 
cDNA Sequenz abgeleiteten Proteins. 

SEQ ID NO: 5 zeigt die Nukleotidsequenz der isoiierten Hva7-2 cDNA, beginnend mit Position 1 und endend mit 
Position 3109. SEQ ID NO: 5 und SEQ ID NO: 6 zeigen ferner die Aminosauresequenzen des von der Hva7-2 
cDNA Sequenz abgeleiteten Proteins. 

[0027] Figur 1 zeigt den Anstieg des intrazelluiaren Calciums in gentechnisch veranderten Zellen gemaB Beispiel 2 
nach Gabe von Nikotin. Zellen wurden mit Fura-2-acetoxymethylester (5 - 10 jiM in serumfreiem Minimal Essentiellem 
Medium mit 1 % Rinderserumalbumin and 5 mM Calciumchlorid) beladen, mit N-(2-Hydroxyethyl)piperazine-N*-(2-etha- 
nesurfonic acid) (5 mM HEPES) gepufferter Tyrode-LOsung gewaschen und unter einem Fluoreszenzmikroskop (Nikon 
Diaphot) abwechselnd mit Licht der Welleniange 340 nm und 380 nm bestrahlt Ein MeBpunkt entspricht einem Paar 
von Videobildern bei beiden Welleniangen (Belichtungszeit pro Bild 100 ms). Der Zeitabstand von zwei MeBpunkten 
betragt 3 s. Nach Aufnahme von 8 Bildern (MeBpunkt 4.0) wurde Nikotin auf eine Endkonzentration von 500 fiM zuge- 
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geben, und die MeBreihe fortgesetzt. Die Fluoreszenzintensrtat der Zellen bei Bestrahlung mit Licht der Welleniange 
380 nm wurde durch die entsprechende Intensity bei 340 nm geteilt und so das Verhaitnis ("Ratio") gebildet. 

Beispiele: 
Beispiel 1 

Isolierung der beschriebenen PolynukJeotidsequenzen 

[0028] Die Manipulation von Polynukleotiden erfolgte nach Standardmethoden der rekombinanten DNA Technologie 
(Sambrook, et aL, 1989). Die bioinformatische Bearbeitung von NuWeotid- und Proteinsequenzen erfolgten mit dem 
Prograrnmpaket GCG Version 9.1 (GCG Genetics Computer Group, Inc., Madison Wisconsin, USA). 

Partielle PolynuWeotidsequenzen 

[0029] Aus Proteinsequenzen von Gen en t bei denen ihre Fahigkeit homooligomere Acetylcholinrezeptoren auszubil- 
den bekannt war, wurden durch Sequenzvergleiche ("Clustalw") Bereiche identifiziert, aus denen durch Rucktranslation 
der Codons degenerierte Oligonukleottde abgeleitet wurden. Insgesamt wurden 5 solcher OligonuWeotidpaare fur die 
Polymerasekettenreaklion (PCR) ausgewfihlt. Nur eine Kombination (vide infra) ergab ein Produkt sowohl aus 
Heliothis-cDNA als auch aus Drosophila-cDNA. 

[0030] RNA wurde aus gesamten Heliothis virescens-Embryonen (kurz vor Schlupf) mittels Trizol-Reagenz (Gibco 
BRL, nach Angaben des Hersteilers) isoliert. In gleicher Weise wurde mit Drosophila-Embryonen (24 h bei 25°C) ver- 
fahren. 10 \iq dieser RNAs wurden in eine cDNA-Erststrangsynthese (Superscript PrSamplifizierungssystem fur die 
cDNA-Erststrangsynthese, Gibco BRL, nach Angaben des Hersteilers, 45°C Reaktionstemperatur) eingesetzt. 
[0031] AnschlieGend wurden jeweils 1/100 der o.g. Erststrang-cDNA in eine Polymerasekettenreaktion (PCR) mit den 
Oligonukleotiden alpha7-1s: (5'-GAYGTIGAYGARAARAAYCA-3*) und alpha7-2a: (5 , -CYYTCRTCIGCRCTRTTRTA-3 , ) 
eingesetzt (Taq DNA Polymerase, rekombinant, Gibco BRL). Die PCR-Parameter waren wie folgt: Hva7-1 und Hva-7- 
2: 94°C. 2 mm; 35 mal (94°C, 45 s; 50°C, 30 s; 72°C, 60 s) sowie Da7: 96°C ( 2 min; 35 mal (96°C, 45 s; 50°C. 30 s; 
72°C, 60 s). Hieraus ergab sich jeweils eine im Agarosegel (1 %) erkennbare Bande von ca. 0,2 kb sowohl bei Droso- 
phila-cDNA als auch bei Heliothis-cDNA. Nach Subkionierung der DNA-Fragmente mittels SrfScript (Stratagene) und 
Bestimmung der DNA-Sequenz, zeigte sich, daB aus Heliothis-cDNA zwei verschiedene DNA-Fragmente amplifiziert 
worden waren; diese waren 228-1 1 = Hva7-1(partiell t mit 165 bp) und 228-8 = Hva7-2 (partiell, mit 171 bp). Aus Dro- 
sophila-cDNA wurde nur ein DNA-Fragment isoliert; dieses war 248-5 = Da7(partiell, mit 150 bp). 

Isolierung von poly A enthaltender RNA aus Heliothis virescens-Gewebe und Konstruktion der cDNA-Bibliotheken 

[0032] Die RNA f Or die cDNA-Bibliothek I wurde aus gesamten Heliothis virescens-Embryonen (kurz vor Schlupf) mit- 
tels Trizol-Reagenz (Gibco BRL, nach Angaben des Hersteilers) isoliert. Die RNA for die cDNA-Bibliothek II wurde aus 
gesamten Kbpfganglien von 500 Heliothis virescens-Larven (Stadien 4-5) mittels Trizol-Reagenz (Gibco BRL, nach 
Angaben des Hersteilers) isoliert. Aus diesen RNAs wurden nun die poly A enthaltenden RNAs durch Reinigung uber 
Dyna Beads 280 (Dynal) isoliert. 5 ng dieser poly A enthaltenden RNAs wurden anschlieBend in die Konstruktion der 
cDNA-Bibliotheken I und II mit dem X-ZAPExpress Vektor eingesetzt (cDNA Synthesis Kit, ZAP-cDNA Synthesis Kit 
und ZAP-cDNA Gigapack III Gold Cloning Kit, alle Stratagene). In Abweichung von den Angaben des Hersteilers wurde 
zur cDNA-Synthese die Reverse Transkriptase Superscript (Gibco BRL) bei einer Synthesetemperatur von 45°C ver- 
wendet. AuBerdem wurde auf die Zugabe radioaktiv markierter Desoxynukleosidtriphosphate verzichtet. Desweiteren 
wurden die synthetisierten cDNAs nicht uber das im Kit enthaltene Gelfiftrationsmedium, sondern uber Size Sep 400 
Spun Columns (Pharmacia) fraktioniert. 

Vollstandige PolynuWeotidsequenzen 

[0033] Mit Ausnahme der ersten Screening Runde bei der Isolierung des Hva7-1 Klons. erfolgten alle Screens mit 
Hilfe des DIG Systems (alle Reagenzien und Verbrauchsmaterialien Boehringer Mannheim, nach Angaben im The 
DIG System User's Guide for Filter Hybridization", Boehringer Mannheim). Die eingesetzten DNA-Sonden wurden 
durch PCR mrttels Digoxygenin markiertem dUTP prapariert, Die Hybridisierungen erfolgten in DIG Easy Hyb (Boehrin- 
ger Mannheim) bei 42°C Qber Nacht. Der Nachweis markierter DNA auf Nylonmembranen geschah durch Chemolumi- 
neszenz (CDP-Star, Boehringer Mannheim) unter Verwendung von ROntgenfilmen (Hyperfiim MP, Amersham). Die 
isolierten Genbankplasmide wurden zur Identjfikation mittels T3 und T7 Primer ansequenziert (ABI Prism Dye Termi- 
nator Cycle Sequencing Kit, ABI. mit ABI Prism 310 Genetic Analyzer). Die Bestimmung der vollstandigen Polynukleo- 
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tidsequenzen in Hva7-1. Hva7-2 und Da7 erfolgte durch Primer Walking mittels Cycle Sequencing als 
Auftragssequenzierung bei der Firma Qiagen, Hilden. 

a. Isolierung des Da7 Klons 

[0034] 10 6 Phagen einer Drosophila melanogaster-cDNA-Bibliothek in X Phagen (Canton-S embryo, 2-1 4 Stunden. 
in Uni-ZAP XR Vektor, Stratagene) wurden einem Screening mit DIG markiertem 248-5 als Sonde unterzogen (nach 
Angaben des Herstellers Stratagene). Die maximale Stringenz beim Waschen der Filter betrug: 0,2 x SSC; 0,1 % SDS; 
42°C; 2 x 15 min. Es konnte ein Klon isoliert werden{Klon 432-1), dessen Insert eine Gr6l3e von 2940 bp aufwies (Da7, 
SEQ ID NO: 1). Der grOBte offene Leserahmen dieser Sequenz beginnt bei der Position 372 der dargestellten Sequenz 
und endet bei Position 1822. Das hieraus abgeleitete Polypeptid umfaBt 770 AminosSuren (SEQ ID NO: 2) und besitzt 
ein errechnetes Molekulargewicht von 87,01 kD. 

b. Isolierung des Hva7-1 Klons 

[0035] In das Screening gingen 10 6 Phagen der Heliothis virescens-Embryo-cDNA-Bibliothek (Bibliothek I) ein. Die 
erste von drei Screening Runden fand unter Verwendung a- 32 P markierter 228-1 1 DNA als Sonde statt. Die Hybridisie- 
rung der Sonde an die Filter erfolgte in Quickhyb (Stratagene) bei 68°C f Or eine Stunde. AnschlieGend wurden die Filter 
zwei mal je 15 min bei Raumtemperatur in 2 x SSC; 0,1 %SDS und 2 mal je 30 min bei 42°C in 0,1xSSC; 0,1 % SDS 
gewaschen. Die Detektion hybridisierter Sonden erfolgte durch Autoradiographie mit XR ROntgenfilmen (Kodak) unter 
Verwendung von Verstarkerfolien (Amersham) bei -80°C uber Nacht. Die zwei weiteren Screening Runden erfolgten 
unter Verwendung des DIG Systems (Boehringer Mannheim). 

[0036] Der in diesem Screen isolierte Klon 241 -5 enthielt ein Insert von 3630 bp. Dieses Insert (Hva7-1 , SEQ ID NO: 
3) besitzt einen langsten offenen Leserahmen, der bei Position 335 der dargestellten Nukleinsauresequenz beginnt und 
bei Position 1821 endet. Das hieraus abgeleitete Polypeptid umfaGt 496 Aminosauren (SEQ ID NO: 4) und besitzt ein 
errechnetes Molekulargewicht von 56.36 kD. 

c. Isolierung des Hva7-2 Klons 

[0037] In das Screening gingen 10 6 Phagen der Heliothis virescens-Ganglien-cDNA-Bibliothek (Bibliothek II) ein. Als 
Sonde wurde Dig markierte 228-8 DNA verwendet Die maximale Stringenz beim Waschen der Filter betrug* 0 1 x 
SSC; 0, 1% SDS; 42°C; 2x15 min. 

[0038J Der in diesem Screen isolierte Klon 241-5 enthielt ein Insert von 3630 bp. Dieses Insert (Hva7-2, SEQ ID NO: 
5) besitzt einen langsten offenen Leserahmen, der bei Position 95 der dargestellten Nukleinsauresequenz beginnt und 
bei Position 1598 endet. Das hieraus abgeleitete Polypeptid umfaBt 501 Aminosauren (SEQ ID NO: 6) und besitzt ein 
errechnetes Molekulargewicht von 56,71 kD. 

Beispiel 2 

Generierung der Expressionskonstrukte 

a. Da7 

[0039] Mittels Polymerasekettenreaktion (PCR) wurde der Sequenzbereich von Position 372 bis Position 2681 aus 
SEQ ID NO: 1 amplifiziert. Hierzu wurden DesoxyoligonuWeotide mit den Sequenzen 

GCGAATTCACCACCATGAAAAATGCACAACTG sowie CGAGACAATAATATGTGGTGCCTCGAG verwendet. Als 
DNA-Polymerase wurde die Pfu- Polymerase von Stratagene nach Angaben des Herstellers verwendet. Nach erfolgter 
Amplifikation wurde das generierte Stuck mit den Restriktionsendonukleasen Eco Rl und Xho I verdaut und in einen 
ebenfalls Eco Rl und Xhol verdauten Vektor pcDNA3.1/Zeo (Invitrogen) einkloniert. 

b. Hva7-1 

[0040] Mittels Polymerasekettenreaktion (PCR) wurde der Sequenzbereich von Position 335 bis Position 1822 aus 
SEQ ID NO: 3 amplifiziert. Hierzu wurden DesoxyoligonuWeotide mit den Sequenzen 

GCAAGCTTACCACCATGGGAGGTAGAGCTAGACGCTCGCAC sowie GCCTCGAGCGACACCATGATGTGTGGCGC 
verwendet. Als DNA-Polymerase wurde die Pfu-Polymerase von Stratagene nach Angaben des Herstellers verwendet. 
Nach erfolgter Amplifikation wurde das generierte Stock mit den Restriktionsendonukleasen Hind II I und Xho I verdaut 
und in einen ebenfalls Hindlll und Xhol verdauten Vektor pcDNA3.1/Zeo (Invitrogen) einkloniert. 
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c. Hva7-2 

[0041] Mittels Polymerasekettenreaktion (PCR) wurde cler Sequenzbereich von Position 95 bis Position 1597 aus 
SEQ ID NO: 5 amplif iziert Hierzu wurden DesoxyoligonuWeotide mit den Sequenzen 
s GCAAGCGCCGCTATGGCCCCTATGTTG sowie TTGCACGATGATATGCGGTGCCTCGAGCG verwendet. Als DNA- 
Poiymerase wurde die Pfu-Polymerase von Stratagene nach Angaben des Herstellers verwendet. Nach erfolgter Ampli- 
f ikation wurde das generierte Stuck mit den Restriktionsendonukleasen Hindlll und Xho I verdaut und in einen ebenfails 
Hindlll und Xhol verdauten Vektor pcDNA3.1/Zeo (Invitrogen) einkloniert. 

10 d.Hva7-1 / 5HT 3 sowie Hva7-2 / 5HT 3 Chimaren 

[0042] Durch die Methode der Overlap Extension (Jespersen et al. 1997) wurde jeweils der Bereich von Position 335 
bis Position 1036 aus SEQ ID NO: 3 (Hva7-1/5HT 3 Chimare) sowie der Bereich von Position 95 bis Position 763 aus 
SEQ ID NO: 5 (Hva7-2/5HT 3 Chimare) mit dem Bereich von Position 778 bis Position 1521 aus der Mus museulus 5- 
15 HT 3 Rezeptor-cDNA (Sequenz in EMBL Datenbank: M774425) fusioniert. Die beiden Fragmente wurden anschlie&end 
mittels TA Cloning (Invitrogen, nach Angaben des Herstellers) in den pcDNA3.1/Zeo Vektor kloniert Konstrukte mit kor- 
rekter Orierrtierung der beiden Fragmente im Vektor wurden durch Sequenzierung mit dem T7 Primer (Invitrogen) iden- 
tif iziert. 

20 Zellkultur und Gentransfer 

[0043] HEK293-Zellen, die die a-Urrtereinheit eines L-Typ Ca-Kanals exprimieren (Zong et al. 1995. Stetzer et al. 
1996), wurden in Dulbeccos Modified Eagles Medium und 10 % foetalem Katberserum bei 5 % C0 2 und 20°C bis 37°C 
kultiviert FQr den Gentransfer wurde FuGENE 6 (Boehringer Mannheim GmbH, Mannheim, Deutschland) nach Anga- 
25 ben des Herstellers verwendet. 24 h bis 48 h nach dem Gentransfer wurden die Zellen in verschiedenen Dichten in 
Mikrotiterplatten ausgesat. Gentechnisch veranderte Zellen wurden durch Wachstum in Dulbeccos Modified Eagles 
Medium und 10 % foetalem Kaiberserum und 150 - 500 ug/ml Zeocin wahrend 3 bis 4 Wochen selektioniert Resistente 
Einzelkione wurden wie unten beschrieben analysiert 

30 Fura-2-Messungen 

[0044] Die Veranderungen der irrtrazelluiaren Calcium-Konzentration wurden mit Fura-2 gemessen. Eine Stammld- 
sung mit 2 mM Fura-2-acetoxymethylester (Sigma) in Dimethylsurfoxid (DMSO) wurde auf eine Endkonzentration von 
5 - 10 jiM in serumfreiem Minimal Essentiellem Medium (MEM, Gibco) mit 1% Rinderserumalbumin and 5 mM Calci- 

35 umchlorid verdOnnt. Die Zellen wurden in einer Mikrotiterplane in dieser LOsung 45 bis 60 min lang inkubiert. Anschlie- 
Bend wurden die Zellen zweimal in N-(2-Hydroxyethyl)piperazine-N -(2-ethanesulfbnic acid) (5 mM HEPES) gepufferter 
Tyrode-LOsung (HEPES-gepufferte Salzldsung mit 130 mM NaO, 5 mM KCI. 2 mM CaCI2, 1 mM MgCI2, 5 mM 
NaHC03, 10 mM Glucose) gewaschen. 1 00 pi Tyrodepuffer wurde in die Vertiefungen der Mikrotrterplatte gegeben und 
die Zellen wurden unter einem Fluoreszenzmikroskop (Nikon Diaphot) abwechselnd mit Ucht der Welleniange 340 nm 

40 und 380 nm bestrahlt. Eine Serie von Videobildern (Belichtungszeit pro Bild 100 ms) wurde mit Pausen von 3 Sekunden 
aufgenommen und als digitalisierte Bilder in einem Bildananlyse-Computer gespeichert (Leica, Quarrtimet 570). Nach 
Aufnahme von 8 Bildern (MeBpunkt 4.0 in Fig. 1) wurde Nikotin auf eine Endkonzentration von 500 jiM zugegeben, und 
die MeBreihe fortgesetzt. Die Fluoreszenzintensitat der Zellen bei Bestrahlung mit Licht der Welleniange 380 nm wurde 
durch die entsprechende Intensitat bei 340 nm geteirt und so ein Verhaitnis gebildet, das den relativen Anstieg der Cal- 

45 cium-Konzentration darstelrt (Grynkiewicz et al. 1 985). 
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SEQUENZPROTOKOLL 
<110> Bayer Aktiengesellschaf t 

<120> Nukleinsauxen, die fOr 

Acetylcholinrezeptor-Untereinheiten von Insekten 
kodieren 

<130> Le A 33 020-BP 

<140> 99107BS2.8 
<141> 1999-04-21 

<150> DE 198 19 829.9 
<151> 1996-05-04 

<160> 6 

<170> Patentln Ver. 2.1 

<210> 1 
<211> 28S6 
<212> DMA 

<213> Drosophila melanogaster 

<220> 
<221> CDS 

<222> (372) (2681) 
<400> 1 

ggcacgagaa aaagttgtgg tataaacttt tattgtagga aaacgcataa aaataataga 60 

aaaacgctct tcgggttgta aagaaaataa gaagacaaaa gaaagacatg aaaacgttgc 120 

aaacaataaa gcatatactt gccatattga tataaaggga aatcgtgaaa aggcggtgaa 180 

aatttcgtaa gactagttgg tatcaagggc agcccatgca cacagctaaa aagggaacta 240 

aaaaaacccc gcacagaaca atgaaagctg cagcagctgg ataaggccga caaaaccgaa 300 

aattatatta ttgtaatcta gtagagagca gacaacatat ccgctggcaa caaccaacac 3 60 

cgaaagagac t atg aaa aat gca caa ctg aaa ctg act gaa gtt gac gat 410 
Met Lys Asn Ala Gin Leu Lys Leu Thr Glu Val Asp Asp 
1 5 io 

gat gag ctg tgg ctg gca gta aga tta gcg cac tgc age age aac ttt 45 8 
Asp Glu Leu Trp Leu Ala Val Arg Leu Ala His Cys Ser Ser Asn Phe 
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15 20 25 

5 age age agt age age aca aga acc ace age age aac cag agg cac aac 506 

Ser Ser Ser Ser Ser Thr Arg Thr Thr Ser Ser Asn Gin Arg His Asn 
30 35 40 45 

cag caa etc aca aca ctg caa cca agg age tea agt aca aaa cac cac 554 
10 Gin Gin Leu Thr Thr Leu Gin Pro Arg Ser Leu Ser Thr Lys His His 

50 55 60 

age aac att gca age gag cag cac aat age cag caa cag gag cca gca 602 
Ser Asn He Ala Ser Glu Gin His Asn Ser Gin Gin Gin Glu Pro Ala 
15 65 70 75 

teg aag gac gag gat gta gec aac cac ggt aga age aat gac cag cag 650 
Ser Lys Asp Glu Asp Val Ala Aan His Gly Arg Ser Asn Asp Gin Gin 
80 85 90 

20 

acg cat ctg caa cag eta gac age age aac atg ttg teg cca aag aca 698 
Thr His Leu Gin Gin Leu Asp Ser Ser Asn Met Leu Ser Pro Lys Thr 
9S 100 105 

25 

gee gca gca gca act get gee ggc gat gaa gca aca acc caa caa cca 74 6 
Ala Ala Ala Ala Thr Ala Ala Gly Asp Glu Ala Thr Thr Gin Gin Pro 
110 115 120 12S 

30 aca aac ata aga ctg tgt gca cgc aag cga caa cga ttg cgt cgc cga 794 

Thr Asn He Arg Leu Cys Ala Arg Lys Arg Gin Arg Leu Arg Arg Arq 
130 135 140 



35 



40 



45 



50 



55 



cga aaa aga aaa cca gca acc cca aac gaa aca gat ate aag aaa caa 84 2 
Arg Lys Arg Lys Pro Ala Thr Pro Asn Glu Thr Asp He Lys Lys Gin 
145 150 155 

cag caa ctt age atg cct ccc ttc aaa acg cgc aaa tec acg gac acc 690 
Gin Gin Leu Ser Met Pro Pro Phe Lys Thr Arg Lys Ser Thr Asp Thr 
160 165 170 

tac age aca cca gca gca aca acc age tgt ccg aca gee acc tac atg 93 8 
Tyr Ser Thr Pro Ala Ala Thr Thr Ser Cys Pro Thr Ala Thr Tyr Met 
175 180 185 

caa tgt cga gee age gac aat gag ttc agt att ccg ata teg aga cat 986 
Gin Cys Arg Ala Ser Asp Asn Glu Phe Ser He Pro lie Ser Arg Hia 
190 195 200 205 

gat aga gta tec acg gec aca ttc gec tgg gtg ttg cat gtg ctg cag 1034 
Asp Arg Val Ser Thr Ala Thr Phe Ala Trp Val Leu His Val Leu Gin 
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210 215 220 

5 gtg ctg etc gtg teg ctg caa cag tgg caa ctt cac gtg caa cag cga 1082 

Val Leu Leu Val Ser Leu Gin Gin Trp Gin Leu His Val Gin Gin Arg 
225 230 235 

teg gtg eta ctg ttc aga agg ate gca gcg age acc ate gee ttc att 1130 
10 Ser Val Leu Leu Phe Arg Arg He Ala Ala Ser Thr He Ala Phe He 

240 245 250 

tec tat tta ggc age ttt gca gcg caa ctg aaa aat age age age age 1178 
Ser Tyr Leu Gly Ser Phe Ala Ala Gin Leu Lye Asn Ser Ser Ser Ser 
255 260 265 



15 



20 



agt age age age aac age age aac aac age age acg caa ata tta aac 1226 
Ser Ser Ser Ser Asn Ser Ser Asn Asn Ser Ser Thr Gin He Leu Asn 
270 275 2B0 285 

gga ctt aat aaa cac tea tgg ata ttt tta ttg ata tat ttg aat tta 1274 
Gly Leu Asn Lys His Ser Trp He Phe Leu Leu He Tyr Leu Asn Leu 
290 295 300 

tct get aaa gtt tgc eta gca gga tat cat gaa aag aga ctg tta cac 1322 
Ser Ala Lys Val Cys Leu Ala Gly Tyr His Glu Lys Arg Leu Leu His 
30S 310 31S 

30 gat ctt ttg gat cct tat aat aca eta gaa cgt ccc gtt etc aat gaa 1370 

Asp Leu Leu Asp Pro Tyr Asn Thr Leu Glu Arg Pro Val Leu Asn Glu 
320 325 330 



25 



35 



40 



45 



50 



teg gac ccg tta caa tta age ttt ggt tta act tta atg caa att ate 1418 
Ser Asp Pro Leu Gin Leu Ser Phe Gly Leu Thr Leu Met Gin He He 
335 340 345 

gat gtg gac gag aaa aat caa ttg eta gtc act aat gtg tgg tta aaa 1466 
Asp Val Asp Glu Lys Asn Gin Leu Leu Val Thr Asn Val Trp Leu Lys 
350 355 360 365 

ctg gag tgg aac gac atg aat etc cgc tgg aac acc tec gac tat ggc 1514 
Leu Glu Trp Asn Asp Met Asn Leu Arg Trp Asn Thr Ser Asp Tyr Gly 
370 375 380 

gga gtt aag gat ctg cga ata ccg ccg cat cgc ate tgg aag ccg gac 1562 
Gly Val Lys Asp Leu Arg He Pro Pro His Arg He Trp Lys Pro Asp 
3BS 390 395 

gcg ctg atg tac aac agt gcg gat gag gga ttt gac ggc acc tac cag 1610 
Val Leu Met Tyr Asn Ser Ala Asp Glu Gly Phe Asp Gly Thr Tyr Gin 



55 
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400 405 410 

5 acg aac gtg gtg gtg egg aac aac ggc teg tgt eta tac gtt ccg ccg 1658 

Thr Asn Val Val Val Arg Asn Asn Gly Ser Cys Leu Tyr Val Pro Pro 

415 420 425 

ggg ate ttc aag teg acg tgc aag ate gac ate acg tgg ttc ccc ttc 1706 

10 Gly He Phe Lys Ser Thr Cys Lys He Asp lie Thr Trp Phe Pro Phe 

430 435 440 445 

gat gac cag egg tgc gag atg aag ttc ggc agt tgg acc tac gac gga 1754 

Asp Asp Gin Arg Cys Glu Met Lys Phe Gly Ser Trp Thr Tyr Asp Gly 

4S0 455 460 



75 



ttc cag ctg gat tta caa tta caa gat gaa act ggc ggc gat ate age 1802 
Phe Gin Leu Asp Leu Gin Leu Gin Asp Glu Thr Gly Gly Asp He Ser 
465 470 475 

agt tac gtg etc aac ggc gag tgg gaa eta ctg ggt gtg ccc ggc aaa 1850 
Ser Tyr Val Leu Asn Gly Glu Trp Glu Leu Leu Gly Val Pro Gly Lys 
480 485 490 

cgt aac gag ate tat tac aac tgc tgc ccg gaa ccc tat ata gac ate 189B 
Arg Asn Glu He Tyr Tyr Asn Cys Cys Pro Glu Pro Tyr He Asp He 
495 500 505 

30 acc ttc gec ate ate ate cgc cga cga aca ctg tac tat ttc ttc aac 1945 

Thr Phe Ala He He He Arg Arg Arg Thr Leu Tyr Tyr Phe Phe Asn 
510 515 520 525 



20 



25 



35 



40 



50 



55 



ctg ate ata cct tgt gta ctg att gec tec atg gee ttg etc gga ttc 1994 

Leu He lie Pro Cys Val Leu lie Ala Ser Met Ala Leu Leu Gly Phe 
530 535 540 

acc ctg ccg cca gat teg ggt gaa aaa tta teg ctg ggt gtt acc ate 2042 

Thr Leu Pro Pro Asp Ser Gly Glu Lys Leu Ser Leu Gly val Thr He 
545 550 555 



ttg etc teg ctg acc gtg ttt ctg aat atg gtt gee gag aca atg ccg 2090 

Leu Leu Ser Leu Thr Val Phe Leu Asn Met Val Ala Glu Thr Met Pro 

45 560 565 570 

get act tec gat gcg gtg cca ttg tgg ata cgc ate gtg ttt ttg tgc 2138 

Ala Thr Ser Asp Ala Val Pro Leu Trp He Arg He Val Phe Leu Cys 

575 580 585 



tgg ctg cca tgg ata ttg cga atg agt cgc cca gga cga ccg ctg ate 2186 
Trp Leu Pro Trp He Leu Arg Met Ser Arg Pro Gly Arg Pro Leu He 
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590 S 95 600 



60S 



eta gag ttc ccg acc acg ccc tgt teg gac aca tec tec gag egg aag 2234 
Leu Glu Phe Pro Thr Thr Pro Cys Ser Asp Thr Ser Ser Glu Arg Lys 
€10 615 620 

cac cag ata etc tec gac gtt gag ctg aaa gag cgc teg teg aaa teg 2282 
His Gin He Leu Ser Asp Val Glu Leu Lys Glu Arg Ser Ser Lys Ser 
625 630 635 

ctg ctg gec aac gta eta gac ate gat gat gac ttc egg cac aat tgt 2330 
Leu Leu Ala Asn Val Leu Asp lie Asp Asp Asp Phe Arg Hie Asn Cys 
640 645 6S0 

cgc ccc atg acg ccc ggc gga aca ctg cca cac aac ccg get ttc tat 2378 
Arg Pro Met Thr Pro Gly Gly Thr Leu Pro His Asn Pro Ala Phe Tyr 
655 660 665 

cgc acg gtt tat gga caa ggc gac gat ggc age att ggg cca att ggc 2426 
Arg Thr Val Tyr Gly Gin Gly Asp Aap Gly Ser He Gly Pro lie Gly 
670 675 680 685 

age acc cga atg ccg gat gcg gtc acc cat cat acg tgc ate aaa tea 2474 
Ser Thr Arg Met Pro Asp Ala Val Thr His His Thr Cys lie Lys Ser 
690 695 700 

tea act gaa tat gaa tta ggt tta ate tta aag gaa att cgc ttt ata 2 522 
Ser Thr Glu Tyr Glu Leu Gly Leu He Leu Lys Glu He Arg Phe He 
70S 710 71S 

act gat cag eta cgt aaa gat gac gag tgc aat gac att gee aat gat 2S70 
Thr Asp Gin Leu Arg Lys Asp Asp Glu Cys Asn Asp He Ala Asn Asp 
720 725 730 

tgg aaa ttt gca get atg gtc gtt gac aga ctg tgc ctt ate ata ttc 2618 
Tip Lya Phe Ala Ala Met Val Val Asp Arg Leu Cys Leu He lie Phe 
73S 740 745 

aca atg ttc gca ata tta gee aca ata get gta eta eta teg gca cca 2666 
Thr Met Phe Ala He Leu Ala Thr He Ala Val Leu Leu Ser Ala Pro 
750 755 760 765 

cat att att gtc teg tagecatatg ggcgaggtgg ttattgttat tggttttatt 2721 
His He He Val Ser 
770 



ataaaatcaa tttgttaatt attaaattaa taacgaaact ctttaagtaa attaaaacta 2781 
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10 



15 



20 



aaaagacact aaaaaagcac aaaaaaatag gaaaatacat gataaaaccc atgaactaaa 2841 
taatacatcc aagaaaaacc aaaacaaaaa aaaaaaaaaa aaaaa 2B86 



<210> 2 
<211> 770 
<212> PRT 

<213> Drosophila melanogaster 
<400> 2 

Met Lys Asn Ala Gin Leu Lys Leu Thr Glu Val Asp Asp Asp Glu Leu 
15 10 15 

Trp Leu Ala Val Arg Leu Ala Hie Cys Ser Ser Asn Phe Ser Ser Ser 
20 25 30 

Ser Ser Thr Arg Thr Thr Ser Ser Asn Gin Arg Hie Asn Gin Gin Leu 
35 40 45 

Thr Thr Leu Gin Pro Arg Ser Leu Ser Thr Lys His His Ser Asn lie 
25 50 55 60 

Ala Ser Glu Gin His Asn Ser Gin Gin Gin Glu Pro Ala Ser Lys Asp 
65 70 75 80 

30 

Glu Asp Val Ala Asn His Gly Arg Ser Asn Asp Gin Gin Thr His Leu 
85 90 95 

Gin Gin Leu Asp Ser Ser Asn Met Leu Ser Pro Lys Thr Ala Ala Ala 
100 105 110 

Ala Thr Ala Ala Gly Asp Glu Ala Thr Thr Gin Gin Pro Thr Asn He 
115 120 125 

40 Arg Leu Cys Ala Arg Lys Arg Gin Arg Leu Arg Arg Arg Arg Lys Arg 

130 135 140 

Lys Pro Ala Thr Pro Asn Glu Thr Asp He Lys Lys Gin Gin Gin Leu 
145 150 155 160 

Ser Met Pro Pro Phe Lys Thr Arg Lys Ser Thr Asp Thr Tyr Ser Thr 
165 170 175 

Pro Ala Ala Thr Thr Ser Cys Pro Thr Ala Thr Tyr Met Gin Cys Arg 
180 185 190 

Ala Ser Asp Asn Glu Phe Ser He Pro He Ser Arg His Asp Arg Val 



35 



45 



SO 



55 
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200 205 

Ser Thr Ala Thr Phe Ala Trp Val Leu His Val Leu Gin Val Leu Leu 
210 215 220 

Val Ser Leu Gin Gin Trp Gin Leu His Val Gin Gin Arg Ser Val Leu 
225 230 235 240 

Leu Phe Arg Arg lie Ala Ala Ser Thr lie Ala Phe He Ser Tyr Leu 
245 250 2S5 

Gly Ser Phe Ala Ala Gin Leu Lye Asn Ser Ser Ser Ser Ser Ser Ser 
260 265 270 

Ser Asn Ser Ser Asn Asn Ser Ser Thr Gin He Leu Asn Gly Leu Asn 
275 280 205 

Lys His Ser Trp lie Phe Leu Leu He Tyr Leu Asn Leu Ser Ala Lys 
290 295 300 

Val Cys Leu Ala Gly Tyr His Glu Lys Arg Leu Leu His Asp Leu Leu 
30S 310 315 320 

Asp Pro Tyr Asn Thr Leu Glu Arg Pro Val Leu Asn Glu Ser Asp Pro 
325 330 335 

Leu Gin Leu Ser Phe Gly Leu Thr Leu Met Gin He He Asp Val Asp 
340 345 350 

Glu Lys Asn Gin Leu Leu Val Thr Asn Val Trp Leu Lys Leu Glu Trp 
355 360 365 

Asn Asp Met Asn Leu Arg Trp Asn Thr Ser Asp Tyr Gly Gly Val Lys 
370 375 360 

Asp Leu Arg He Pro Pro His Arg He Trp Lys Pro Asp Val Leu Met 
3as 390 395 400 

Tyr Asn Ser Ala Asp Glu Gly Phe Asp Gly Thr Tyr Gin Thr Asn Val 
405 410 415 

Val Val Arg Asn Asn Gly Ser Cys Leu Tyr Val Pro Pro Gly He Phe 
420 425 430 

Lys Ser Thr Cys Lys He Aap He Thr Trp Phe Pro Phe Asp Asp Gin 
435 440 445 



Arg Cys Glu Met Lys Phe Gly Ser Trp Thr Tyr Asp Gly Phe Gin Leu 
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4S0 455 460 

Asp Leu Gin Leu Gin Asp Glu Thr Gly Gly Asp He Ser Ser Tyr Val 
465 470 475 480 

Leu Asn Gly Glu Trp Glu Leu Leu Gly Val Pro Gly Lys Arg Asn Glu 
485 490 495 

He Tyr Tyr Asn Cys Cys Pro Glu Pro Tyr He Asp He Thr Phe Ala 
500 505 S10 

He He lie Arg Arg Arg Thr Leu Tyr Tyr Phe Phe Asn Leu He He 
515 520 525 

Pro Cys Val Leu He Ala Ser Met Ala Leu Leu Gly Phe Thr Leu Pro 
530 535 540 

Pro Asp Ser Gly Glu Lys Leu Ser Leu Gly Val Thr He Leu Leu Ser 
545 550 555 560 

Leu Thr Val Phe Leu Asn Met Val Ala Glu Thr Met Pro Ala Thr Ser 
565 570 575 

Asp Ala Val Pro Leu Trp He Arg He Val Phe Leu Cys Trp Leu Pro 
580 5B5 590 

Trp He Leu Arg Met Ser Arg Pro Gly Arg Pro Leu He Leu Glu Phe 
595 600 60S 

Pro Thx Thr Pro Cys Ser Asp Thr Ser Ser Glu Arg Lys His Gin He 
610 61S 620 

Leu Ser Asp Val Clu Leu Lys Glu Arg Ser Ser Lys Ser Leu Leu Ala 
625 630 635 640 

Asn Val Leu Asp He Asp Asp Asp Phe Arg His Asn Cys Arg Pro Met 
645 650 6S5 

Thr Pro Gly Gly Thr Leu Pro His Asn Pro Ala Phe Tyr Arg Thr Val 
660 ^ 665 670 

Tyr Gly Gin Gly Asp Asp Gly Ser lie Gly Pro He Gly Ser Thr Arg 
675 680 685 

Met Pro Asp Ala Val Thr His His Thr Cys He Lys Ser Ser Thr Glu 
690 69S 700 

Tyr Glu Leu Gly Leu He Leu Lys Glu He Arg Phe He Thr Asp Gin 
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705 



710 



715 



720 



Leu Arg Lys Asp Asp Glu Cys Asn Asp He Ala Asn Asp Trp Lys Phe 
?25 730 735 

Ala Ala Met Val Val Asp Arg Leu Cys Leu He He Phe Thr Met Phe 
740 745 750 

Ala He Leu Ala Thr He Ala Val Leu Leu Ser Ala Pro His He lie 
755 760 765 



Val Ser 
770 



<210> 3 
<211> 3700 
<212> DNA 

<213> Heliothis virescens 

<220> 
<221> CDS 

<222> (335) . . (1822) 
<400> 3 

ggcacgagcc gctgccccac ggtcggccgc actccgctga acaacaatgc tcaaaaacac 60 

gccgtgactc cacacacatc ccctcggcgc agtaggcgat gtttgaggat cggacggcac 12 0 

gcgtggccgt cggcgagcgg tcgtgaacaa gttgcataca tatgaaaacc gtaaaaagat 180 

tgaattttaa gccgatcgtg ttcgatagat cctaatagag aagcgggagt gcggcgtttg 24 0 

gtaggcgggg gtcgagtcgc gcggtcgggg gaaatggcgc ggcgcggggc ggcggcggcg 300 

gcggcgcgcg gcgcggcggc gtcgcggcgc tgac atg ggc ggg egg gcg cgc cgc 355 

Met Gly Gly Arg Ala Arg Arg 
1 5 

teg cac ttg gcg gcg ccc gcg ggc ctg ctg ctg ctg ctg tgc ctg etc 4 03 
Ser His Leu Ala Ala Pro Ala Gly Leu Leu Leu Leu Leu Cys Leu Leu 
io 15 20 

tgg ccg agg ggg gca cgc tgc ggg tac cac gag aag egg eta ctg cac 451 
Trp Pro Arg Oly Ala Arg Cys Gly Tyr His Glu Lys Arg Leu Leu His 
25 30 35 
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10 



15 



20 



25 



35 



40 



45 



50 



cac eta ttg gac cac tac aac gta ctg gag agg ccc gtc gtc aac gag 4 99 
His Leu Leu Asp His Tyr Asn Val Leu Glu Arg Pro Val Val Asn Glu 
40 45 50 55 

age gac ccg ctg cag etc tec ttc ggc etc acg etc atg cag ate ate 547 
Ser Asp Pro Leu Gin Leu Ser Phe Gly Leu Thr Leu Met Gin lie lie 
60 65 70 

gac gtg gac gag aag aac cag ctt tta ata aca aac ate tgg eta aaa 595 
Asp Val Asp Glu Lys Asn Gin Leu Leu lie Thr Asn lie Trp Leu Lys 
75 80 85 

eta gag tgg aat gat atg aac ttg agg tgg aac act tea gat ttc ggc 643 
Leu Glu Trp Asn Asp Met Asn Leu Arg Trp Asn Thr Ser Asp Phe Gly 
90 95 100 

ggg gtc aaa gat tta aga gtg cca ccc cac aga eta tgg aaa cca gac 691 
Gly Vai Lys Asp Leu Arg Val Pro Pro His Arg Leu Trp Lys Pro Asp 
105 110 115 

gtc ctt atg tac aac age gcg gac gaa ggg ttc gac age acg tat cca 73 9 
Val Leu Met Tyr Asn Ser Ala Asp Glu Gly Phe Asp Ser Thr Tyr Pro 
120 125 130 135 



acg aac gtg gtg gtg egg aac aac ggc teg tgt ctg tac gtg ccg ccc 7 87 
30 Thr Asa Val Val Val Arg Asn Asn Gly Ser Cys Leu Tyr Val Pro Pro 

140 145 ISO 

ggc ate ttc aag age acc tgc aag ate gac ate ace tgg ttc ccc ttc 8 35 
Gly He Phe Lys Ser Thr Cys Lys lie Asp He Thr Trp Phe Pro Phe 
155 160 165 

gac gac caa cga tgc gag atg aag ttt ggc age tgg act tat gat ggt 883 
Asp Asp Gin Arg Cys Glu Met Lys Phe Gly Ser Trp Thr Tyr Asp Gly 
170 175 180 

tat cag ttg gat eta caa eta cag gat gaa ggg ggc gga gat ata age 931 
Tyr Gin Leu Asp Leu Gin Leu Gin Asp Glu Gly Gly Gly Asp He Ser 
185 190 195 

agt ttt gtc acg aat ggc gaa tgg gag tta ata gga gtc ccc ggc aag 979 
Ser Phe Val Thr Asn Gly Glu Trp Glu Leu He Gly Val Pro Gly Lys 
200 205 210 215 

cgc aac gag ate tac tac aac tgt tgt ccg gag cca tac ate gac ate 1027 
Arg Asn Glu He Tyr Tyr Asn Cys Cys Pro Glu Pro Tyr He Asp lie 
220 225 230 



55 
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acg ttt gcg gtg gtg ate egg agg aaa acg etc Cac tac ttc ttc aat 1075 
Thr Phe Ala Val Val He Arg Arg Lys Thr Leu Tyr Tyr Phe Phe Asn 
235 240 24S 

ctg ate gtg ccc tgc gtg etc ate gec tec atg get eta ttg ggg ttc 1123 
Leu He Val Pro Cys Val Leu He Ala Ser Met Ala Leu Leu Gly Phe 
250 255 260 

ace ttg cct cca gac tec gga gaa aag ttg tct tta ggt gtg acg ata 1171 
Thr Leu Pro Pro Asp Ser Gly Glu Lye Leu Ser Leu Gly Val Thr He 
265 270 275 

tta ctg teg ttg acg gtg ttc etc aac atg gtg gcg gag acg atg cca 1219 
Leu Leu Ser Leu Thr Val Phe Leu Asn Met Val Ala Glu Thr Met Pro 
280 285 290 295 

20 gcg acg teg gac gec gtg ccc ttg etc ggc acc tac ttc aac tgc ate 1267 

Ala Thr Ser Asp Ala Val Pro Leu Leu Gly Thr Tyr Phe Asn Cys He 
300 305 310 



15 



25 



30 



40 



45 



50 



atg ttc atg gtg get tec tec gtc gtc tee acc ata ctg ate etc aac 1315 
Met Phe Met Val Ala Ser Ser Val Val Ser Thr He Leu He Leu Asn 
31S 320 32S 

cac cac cac egg cac gca gac act cac gaa atg agt gat tgg att cgt 1363 
Tyr His His Arg His Ala Asp Thr His Glu Met Ser Asp Trp He Arg 
330 335 340 



tgc gtg ttc ctt tat tgg ctg ccg tgg gtg ctg cgc atg tea egg ccc 1411 

Cys Val Phe Leu Tyr Trp Leu Pro Trp Val Leu Arg Met Ser Arg Pro 

35 34 S 350 355 

ggc teg gcg acg acg ccg ccg ccg gcg cgc gta cct ccg ccg ccg gac 1459 

Gly Ser Ala Thr Thr Pro Pro Pro Ala Arg Val Pro Pro Pro Pro Asp 
360 365 370 37S 



ctg gag ctg cgc gag cgc tec tec aag teg etc eta gcg aac gtg etc 1507 

Leu Glu Leu Arg Glu Arg Ser Ser Lys Ser Leu Leu Ala Asn Val Leu 
380 385 390 

gac ate gat gac gac ttc cgc cac ccg caa gcg cag cag ccg caa tgc 1555 

Asp He Asp Asp Asp Phe Arg His Pro Gin Ala Gin Gin Pro Gin Cys 

395 400 405 

tgc cga tac tac agg ggg ggt gag gag aat ggc gcg ggg ttg gcg gcg 1603 

Cys Arg Tyr Tyr Arg Gly Gly Glu Glu Asn Gly Ala Gly Leu Ala Ala 
410 415 420 
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cac agt tgc ttc ggt gtc gac tac gag etc tec etc att ctg aag gag 1651 
His Ser Cys Ph Gly Val Asp Tyr Glu Leu Ser Leu lie Leu Lys Glu 
425 430 435 

att aga gtc ate aca gat cag atg cgc aag gac gac gaa gat gcg gac 1699 
lie Arg Val He Thr Asp Gin Met Arg Lys Asp Asp Glu Asp Ala Asp 
440 445 450 455 

att teg cgc gac tgg aag ttc gec gec atg gtc gtg gac aga ctg tgc 1747 
He Ser Arg Asp Trp Lys Phe Ala Ala Met Val Val Asp Arg Leu Cys 
460 465 470 

ctt att ate ttt acc ctg ttc aca ate ate gee acg eta gec gtg ctg 1795 
Leu lie He Phe Thr Leu Phe Thr He Tie Ala Thr Leu Ala Val Leu 
475 460 485 

ctg tec gcg cca cac ate atg gtg teg tagcgacccg cccgcttgcg 1842 
Leu Ser Ala Pro His He Met Val Ser 
490 495 

gataegcatg cgaaaagttc tgtgataccg cgaatatttg ttaagttgtg atgagcgaag 1902 

tggegeggae ggtgacgccg eggegtegga gttgccgccg cctgcctcgc cgcccgcgcc 1962 

cccctgtaga cataagttac cgctgactgc caaccctgta cgttcaacaa ataactgccc 2022 

atccgactaa cgtcttttat ccccttgaaa aattcagega ttgtgtaccc ctttcttcca 2082 

agaatacaat gacaaatggt cgtcacgctc agtggaatca atcccgtact cttcgcccga 2142 

tatttccctt agggtatgtc acgagtttga atgagcggtt cegtatcaga cgttccgtcc 2202 

ccggaacggt cgtcccctgc gataaagtgg cagtacgtgc tatacaggca ettaaggecg 2262 

ccacgccacg gcgccgcggt gcgctcgggc cgcgaacccg cgaccctcac cgctgcaagt 2322 

ggccacccac tagacaagac tgcggcagaa aatatttgea caaaaaegtc ttccttctta 23 82 

ccgatgaacg acctgattcg catttaaaat taaactttgt tagaacttct tcgattcttg 2442 

aaatctattg tacagtttag agtttgggcg gtgaaacaat ggccctttgt ttccttcttg 2S02 

ttcgattcca tgaatcgtgg ttataatccc tagttttatt tteggatata tttgtgtcag 2562 

tagctagtat agaactttac aaacaatgtt gattcaattg gtacaggttg tgatatgect 2622 

cgttgtgaac gggtccgata ttgttataaa tggtaaaata cccatggcta tagcttaata 2682 
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aatcgttcgt taaaagttgt agttaaacaa atattatttt aataaagtca tatctgggtc 2742 
ttccggaacg acttttacaa ataattaaat tacatattaa tatcacgttt gtacttcttt 2802 
ccatacagtt acagtaattc gtatgctgaa aataatatta gcttgtaaaa ttttcttctt 2862 
cgaaaattta ttcaaacaga tgcgaccatc gtetcaaaca tttacatgta atatagaact 2922 
cattttataa gatatacaac actttataag tacaagaagt tgtaacatga accggttttt 2 982 
cgttacatag agggtataac acaaaggtgc ctacatattg acagatgcga agcacgatca 3 042 
gttgataagc acaggtacac tatatcctga catccgacag tcctgccgct cgtctgccac 3102 
actcggaaac attcgacagt tcagtttact gctccgccat catcgattgt taagtttgtt 3162 
gttctaactc atcgcattca tttcattcaa aaacattgta aacctctcaa ggggaaaacg 3222 
tgttgtaaac agtgagagtg cgcgggtaca accgacacgc gaatgtaccc tcgcaaggct 3282 
cctgtaatgt tttcctcttc cgaggtgttg ctgagagtaa tcttagacgg tccgatggaa 3342 
gttgcggacc ggatatgatt acaagtcaat gtttttaagt catccgttta tttattgtta 3402 
tatcttctta ccattcgcta gaggttgtgt gacgacccgg acggtgggcg ccgcaacccg 3462 
cacacgcggg gttccatcct tgtattagat ggaagttgtg cggcatctct ccgtcggcaa 3522 
tgggacaacc cgttgtcccc aacatttgtt caattgttag ggttaactct gaattgcact 35S2 
ccgcctatta aatataaacg aatgaaacaa aaaaaaaaaa aaaaaactcg agagtacttc 3642 
tagagcggcc gcgggcccat cgattttcca cccgggtggg gtaccagtaa gtgtaccc 3700 

<210> 4 
<211> 496 
<212> PRT 

<213> Heliothis virescens 
<400> 4 

Met Gly Gly Arg Ala Arg Arg Ser His Leu Ala Ala Pro Ala Gly Leu 
15 io is 

Leu Leu Leu Leu Cys Leu Leu Trp Pro Arg Gly Ala Arg Cys Gly Tyx 
20 25 30 

His Glu Lys Arg Leu Leu Hie His Leu Leu Asp His Tyr Asn Val Leu 
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35 40 45 

Glu Arg Pro Val Val Asn Glu Ser Asp Pro Leu Gin Leu Ser Phe Gly 
50 55 60 

Leu Thr Leu Met Gin lie He Asp Val Asp Glu Lys Asn Gin Leu Leu 
65 70 75 80 

He Thr Asn He Trp Leu Lys Leu Glu Trp Asn Asp Met Asn Leu Arg 
85 90 95 

Trp Asn Thr Ser Asp Phe Gly Gly Val Lys Asp Leu Arg Val Pro Pro 
100 105 110 

His Arg Leu Trp Lys Pro Asp Val Leu Met Tyr Asn Ser Ala Asp Glu 
115 120 125 

Gly Phe Asp Ser Thr Tyr Pro Thr Asn Val Val Val Arg Asn Asn Gly 
130 135 140 

Ser Cys Leu Tyr Val Pro Pro Gly He Phe Lys Ser Thr Cys Lys He 
145 150 155 160 

Asp He Thr Trp Phe Pro Phe Asp Asp Gin Arg Cys Glu Met Lys Phe 
165 170 175 

Gly Ser Trp Thr Tyr Asp Gly Tyr Gin Leu Asp Leu Gin Leu Gin Asp 
180 185 190 

Glu Gly Gly Gly Asp He Ser Ser Phe Val Thr Asn Gly Glu Trp Glu 
195 200 20S 

Leu He Gly Val Pro Gly Lys Arg Asn Glu He Tyr Tyr Asn Cys Cys 
210 215 220 

Pro Glu Pro Tyr He Asp He Thr Phe Ala Val Val He Arg Arg Lys 
225 230 235 240 

Thr Leu Tyr Tyr Phe Phe Asn Leu He Val Pro Cys Val Leu He Ala 
245 250 255 

Ser Met Ala Leu Leu Gly Phe Thr Leu Pro Pro Asp Ser Gly Glu Lys 
260 265 270 

Leu Ser Leu Gly Val Thr He Leu Leu Ser Leu Thr Val Phe Leu Asn 
275 280 235 

Met Val Ala Glu Thr Met Pro Ala Thr Ser Asp Ala Val Pro Leu Leu 
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290 295 300 

Gly Thr Tyr Phe Aan Cys lie Wet Phe Met Val Ala ser Ser Val Val 
305 310 315 320 

Ser Thr lie Leu He Leu Asn Tyr His His Arg His Ala Asp Thr His 
325 330 335 

Glu Met Ser Asp Trp He Arg Cys Val Phe Leu Tyr Trp Leu Pro Trp 
340 345 350 

Val Leu Arg Met Ser Arg Pro Gly Ser Ala Thr Thr Pro Pro Pro Ala 
355 360 365 

Arg Val Pro Pro Pro Pro Asp Leu Glu Leu Arg Glu Arg Ser Ser Lys 
370 375 380 

Ser Leu Leu Ala Asn Val Leu Asp lie Asp Asp Asp Phe Arg His Pro 
385 390 395 400 

Gin Ala Gin Gin Pro Gin Cys Cys Arg Tyr Tyr Arg Gly Gly Glu Glu 
405 410 415 

Asn Gly Ala Gly Leu Ala Ala His Ser Cys Phe Gly Val Asp Tyr Glu 
420 425 430 

Leu Ser Leu He Leu Lys Glu He Arg Val lie Thr Asp Gin Met Arg 
435 440 445 

Lys Asp Asp Glu Asp Ala Asp He Ser Arg Asp Trp Lys Phe Ala Ala 
450 4S5 460 

Met Val Val Asp Arg Leu Cys Leu He He Phe Thr Leu Phe Thr He 
465 470 475 4B0 

He Ala Thr Leu Ala Val Leu Leu Ser Ala Pro His He Met Val Ser 
465 490 495 



<210> 5 
<211> 3109 
<212> DNA 

<213> Helioehis virescens 

<220> 

<221> CDS 

<222> (95).. (1597) 
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<400> 5 

ggcacgagcc ggccgcacgt tgtcccaggc cgcatgagcg cgccggcgtg ctagcgcagc 60 

gtgcgcgggt gtggtatgcc cgcgcgtcgc cgct atg gcc cct atg ttg gcg gcc 115 

Met Ala Pro Met Leu Ala Ala 
1 S 

ttg gcg ctg ctg get ttg ctg ccc gta teg gag caa ggt cct cac gag 16 3 
Leu Ala Leu Leu Ala Leu Leu Pro Val Ser Glu Gin Gly Pro His Qlu 
10 IS 20 

aag aga etc ctg aac gcg ttg ctg gcg aac tac aac acc ctg gag cga 211 
Lys Arg Leu Leu Asn Ala Leu Leu Ala Asn Tyr Asn Thr Leu Glu Arg 
25 30 35 

ccg gtg gcc aac gag age gaa ccg cca gag gtc agg ttc ggc ttg acc 259 
Pro Val Ala Asn Glu Ser Glu Pro Leu Glu Val Arg Phe Gly Leu Thr 
40 45 50 55 

ttg cag caa ate att gac gtg gac gag aag aat caa eta ctt ata acc 307 
Leu Gin Gin lie He Asp Val Asp Glu Lys Asn Gin Leu Leu He Thr 
€0 65 70 

aat ata tgg ctg teg ttg gag tgg aat gac tac aac ctg agg tgg aac 355 
Asn He Trp Ser Leu Glu Trp Asn Asp Tyr Asn Leu Arg Trp Asn 
7S 80 85 

gac age gag tat ggc ggg gtc aag gac etc agg ate acg ccc aac aag 403 
Asp Ser Glu Tyr Gly Gly Val Lys Asp Leu Arg He Thr Pro Asn Lys 
90 95 100 

ttg tgg aag ccg gac gtc ctt atg tat aat agt get gac gag ggt ttt 451 
Leu Trp Lys Pro Asp Val Leu Met Tyr Asn Ser Ala Asp Glu Gly Phe 
105 110 lis 

gac ggg acc tac cag acc aac gtg gtg gtc aga age ggc ggc agt tgc 499 
Asp Gly Thr Tyr Gin Thr Asn Val Val Val Arg Ser Gly Qly Ser Cys 
120 125 130 135 

ctg tac gtg cca cct ggc ata ttc aag age aca tgc aag atg gac ate 547 
Leu Tyr Val Pro Pro Gly He Phe Lys Ser Thr Cys Lys Met Asp He 

140 145 150 

gcg tgg ttt ccc ttc gac gac caa cac tgt gat atg aag ttc ggt age 595 
Ala Trp Phe Pro Phe Asp Asp Gin His Cys Asp Met Lys Phe Gly Ser 
155 160 165 
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10 
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tgg aca tat gac ggc aat cag ttg gat ctg gtg eta aaa gat gag gca 643 
Trp Thr Tyr Asp Gly Asn Gin Leu Asp Leu Val Leu Lya Asp Glu Ala 
170 175 iao 

ggc ggc gat eta teg gac ttc ata aca aat ggg gag tgg tat eta ata 691 
Gly Gly Asp Leu Sex Aap Phe lie Thr Asn Gly Glu Tip Tyr Leu lie 
185 190 19S 

gga atg cca ggc aaa aag aac aca ata aca tac gcg tgc tgc ccc gag 739 
Gly Met Pro Gly Lys Lye Asn Thr lie Thr Tyr Ala Cys Cye Pro Glu 
200 205 210 215 

ccc tac gtg gac gtc ace ttc acc ate atg ata aga aga cga ace ttg 787 
Pro Tyr Val Asp Val Thr Phe Thr lie Met lie Arg Arg Arg Thr Leu 
220 225 230 

20 tac tac ttc ttc aac ct 9 ate gtc ccg tgc gtg ctg ate tea teg atg B35 

Tyr Tyr Phe Phe Asn Leu lie Val Pro Cys Val Leu He Ser Ser Met 
235 240 245 

gca etc etc ggc ttc aca ctg cca cca gac tec gga gag aaa etc aca 883 
25 Ala Leu Leu Gly Phe Thr Leu Pro Pro Asp Ser Gly Glu Lys Leu Thr 

250 255 260 

ctt gga gtc act att ctt eta teg ctg acg gtg ttc etc aac ctg gta 931 
Leu Gly Val Thr He Leu Leu Ser Leu Thr Val Phe Leu Asn Leu Val 
265 270 275 

gec gag acc ctg cca cag gtc tec gac get ate ccc ctg tta ggg acg 979 
Ala Glu Thr Leu Pro Gin Val Ser Asp Ala lie Pro Leu Leu Gly Thr 
280 285 290 295 

tac ttc aat tgc ate atg ttc atg gta gcg teg tct gtg gta ctg act 1027 
Tyr Phe Asn Cys lie Het Phe Met Val Ala Ser Ser Val Val Leu Thr 
J00 305 310 

gtg gtg gta etc aat tac cac cat cga aca get gat ata cat gaa atg 1075 
Val Val Val Leu Asn Tyr His His Arg Thr Ala Asp He His Glu Met 
315 320 32S 

cca cag tgg ata aaa tea gta ttc eta caa tgg ttg cca tgg ata ctg 112 3 
Pro Oln Trp He Lya Ser Val Phe Leu Gin Trp Leu Pro Trp He Leu 
330 335 340 

cga atg teg agg cca ggg aag aag ate acc agg aag act ata atg atg 1171 
Arg Met Ser Arg Pro Gly Lya Lya He Thr Arg Lys Thr He Met Met 
345 350 355 



30 



35 



40 



45 



50 
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aac acg agg atg agg gag ctg gaa ctg aag gag agg teg teg aag tec 1219 
Asn Thr Arg Met Arg Glu Leu Glu Leu Lys Glu Arg Ser Ser Lye Ser 
360 365 370 375 

ttg ctg gcg aat gtt eta gat att gat gat gac ttc aga cac ggc cct 1267 
Leu Leu Ala Asn Val Leu Aep lie Asp Asp Asp Phe Arg His Gly Pro 
3B0 385 390 

ccg cct cct aac agt act gec teg acc ggg aat ttg gga cct ggg tgc 1315 
Pro Pro Pro Asn Ser Thr Ala Ser Thr Gly Asn Leu Gly Pro Gly Cys 
395 400 405 

tea ata ttc cgc acg gat ttc cgt egg teg ttc gtc cgt ccg tec acg 1363 
Ser lie Phe Arg Thr Asp Phe Arg Arg Ser Phe Val Arg Pro Ser Thr 
410 415 420 

atg gaa gac gtg ggc ggc ggg ctg ggt age cac cat cgc gag ctg cac 1411 
Met Glu Asp Val Gly Gly Gly Leu Gly Ser His His Arg Qlu Leu His 
425 430 435 

etc ata ctg aga gag ctg cag ttc ate acg gee agg atg aag aag get 1459 
Leu lie Leu Arg Glu Leu Gin Phe He Thr Ala Arg Met Lys Lys Ala 
440 445 450 455 

gat gag gaa gec gag ctg ate age gac tgg aag ttt get gcg atg gtt 1507 
Asp Glu Glu Ala Glu Leu He Ser Asp Trp Lys Phe Ala Ala Met Val 
460 465 470 

gtt gat agg ttt tgc ctg ttc gtg ttc aca ctt ttc aca ate ate gcg 1555 
Val Asp Arg Phe Cys Leu Phe Val Phe Thr Leu Phe Thr He He Ala 
475 480 485 

aca gta get gtc ctg tta teg gca ccg cat ate ate gtg caa 1597 
Thr Val Ala Val Leu Leu Ser Ala Pro His He He Val Gin 
490 495 500 

tgaaccaacc actgagcegg caactccggc gcatgaatga gagaaataat tattagatcg 1657 

ccgatttgta attataattg ataatgtaat taaattaaat acgtggttga aacgcacacg 1717 

tctccataac aaagtcttaa gacattaaat tatgataaat ttacatattg tagttaagtc 1777 

gagtgttgat ggaaatttta gccggcgcaa ggagtttcgt gaaggtctgt atatattttt 1837 

tcttattgtt gtatattgta tcgttgttca tgttttcttt caggaagtga gctttgtact 1897 

gtttgtttct tcgatggcag gtgeacttea gttcaggctg aaatttccat taacatttat 1957 
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ttaaacaaat gtgatgttga ctaggatgtc atacagataa atgttgacgt gtataatttg 2017 
ttaaaataaa caatattaat tactattact aaacgatatt ataaacgaag tactaacgag 2077 
ggttacttta atgggaagaa cgctaagctg gcacagagtt gcattaattt gaaaaaagaa 2137 
attacggaaa aaagtttatt gaaaattgaa ctttttggaa ggaaagtaac gtttgatcaa 2197 
aaaagtttgt aaaacgaaag ttcggttctg cgccaatact ggaattaaaa ttctcgtaaa 22S7 
tattagggaa aagaaggtcc tttaaaacaa aagatttgaa ccggcatcct ttttacaagt 2317 
aatgagggat cacagatgat gacaaaaaac cttagggtat ataagtaatg tacataatgg 2377 
atcaaatatc ggtagagtca agaatagtta acgatttaag attattccat tcgatattaa 2437 
aattcgatta gcgattgtcg ctgcgtctac tttgatacat atcgatttga atcgatattg 24 97 
tataaattta gatagatcgg acattagtaa tgagtatgga cgttttaatt tttaaaaaag 2557 
aatgtactac gaagattaaa tccaggaatt gttaaacagt tatggaattg ataagaaatc 2617 
aacaattaat acggaaccaa aggtagacta ggtgtagcat caggagattg aattaaaaca 2677 
taaattagga ccgacttaaa tggaacttgc gagtgtattg ataaettttt aatttaaaaa 2737 
ctcattgtcg attaaatgga gaataacttt tgatctctcg tatcgataaa tgctcactta 2797 
actatcgata gcgtaatatt ataactgtta gtatatcgat atgggagtaa gtcactagca 2657 
tcagaaatag tcattaatta ggaatcggtt tgtgttaatg ttatgcttag cgaaaatatt 2917 
acaatgctgt tgatatcact aaccatcacg taaccatatt gataaaatgt aaatacagaa 2977 
tattgcggtg tgtatttgta tataaatttt agaaaaaaaa aaaaaaaaaa aactcgagag 303 7 
tacttctaga gcggccgcgg gcccatcgat tttccacccg ggtggggtac caggtaagtg 3097 
tacccaattc gc 3109 

<210> 6 
<211> 501 
<212> PRT 

<213> Heliothis virescens 
<400> 6 

Met Ala Pro Met Leu Ala Ala Leu Ala Leu Leu Ala Leu Leu Pro Val 
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i 

Ser Glu Gin Gly 
20 

Asn Tyr Asn Thr 
35 

Glu Val Arg Phe 
50 

Lys Asn Gin Leu 
65 

Asp Tyr Asn Leu 



Leu Arg lie Thr 
100 

Asn Ser Ala Asp 
115 

Val Arg Ser Gly 
130 

Ser Thr Cys Lys 
14S 

Cys Asp Met Lys 



Leu Val Leu Lys 
180 

Asn Gly Glu Trp 
195 

Thr Tyr Ala Cys 
210 

Met He Arg Arg 

225 

Cys Val Leu He 



Asp Sex Gly Glu 



5 

Pro Hi 3 Glu Lys 



Leu Glu Arg Pro 
40 

Gly Leu Thr Leu 
55 

Leu He Thr Asn 

70 

Arg Trp Asn Asp 
85 

Pro Asn Lys Leu 



Glu Gly Phe Asp 
120 

Gly Ser Cys Leu 
135 

Met Asp He Ala 
150 

Phe Gly Ser Trp 
165 

Asp Glu Ala Gly 



Tyr Leu He Gly 
200 

Cys Pro Glu Pro 
215 

Arg Thr Leu Tyr 
230 

Ser Ser Met Ala 
245 

Lys Leu Thr Leu 



10 

Arg Leu Leu Asn 
25 

Val Ala Asn Glu 



Gin Gin He He 
60 

He Trp Leu Ser 
75 

Ser Glu Tyr Gly 
90 

Trp Lys Pro Asp 
105 

Gly Thr Tyr Gin 



Tyr Val Pro Pro 
140 

Trp Phe Pro Phe 
155 

Thr Tyr Asp Gly 
170 

Gly Asp Leu Ser 
185 

Met Pro Gly Lys 



Tyr Val Asp Val 
220 

Tyr Phe Phe Asn 

235 

Leu Leu Gly Phe 
250 

Gly Val Thr He 



15 

Ala Leu Leu Ala 
30 

Ser Glu Pro Leu 
45 

Asp Val Asp Glu 



Leu Glu Trp Asn 
80 

Gly Val Lys Asp 
95 

Val Leu Met Tyr 
110 

Thr Asn Val Val 
125 

Gly He Phe Lys 



Asp Asp Gin His 
160 

Asn Gin Leu Asp 
175 

Asp Phe lie Thr 
190 

Lys Asn Thr He 
205 

Thr Phe Thr He 



Leu He Val Pro 
240 

Thr Leu Pro Pro 
2S5 

Leu Leu Ser Leu 
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260 265 



270 



Thr Val Phe Leu Asn Leu Val Ala Glu Thr Leu Pro Gin val Ser Asp 

275 280 285 

Ala He Pro Leu Leu Gly Thr Tyr Phe Asn Cys He Met Phe Met Val 
290 295 300 

Ala Ser Ser Val Val Leu Thr Val Val Val Leu Asn Tyr His His Arg 
305 310 315 320 

Thr Ala Asp He His Glu Met Pro Gin Trp He Lys Ser Val Phe Leu 
325 330 335 

Gin Trp Leu Pro Trp He Leu Arg Met Ser Arg Pro Gly Lys Lys He 
340 345 350 

Thr Arg Lys Thr He Met Met Asn Thr Arg Met Arg Glu Leu Glu Leu 
355 360 365 

Lys Glu Arg ser ser Lys Ser Leu Leu Ala Asn val Leu Asp He Asp 
370 375 380 

Asp Asp Phe Arg His Gly Pro Pro Pro Pro Asn Ser Thr Ala Ser Thr 
385 390 395 400 

Gly Asn Leu Gly Pro Gly Cys Ser He Phe Arg Thr Asp Phe Arg Arg 
405 410 415 

Ser Phe Val Arg Pro Ser Thr Met Glu Asp Val Gly Gly Gly Leu Gly 
420 425 430 

Ser His His Arg Glu Leu His Leu He Leu Arg Glu Leu Gin Phe He 
435 440 445 

Thr Ala Arg Met Lys Lys Ala Asp Glu Glu Ala Glu Leu lie Ser Asp 
450 4SS 460 

Trp Lys Phe Ala Ala Met Val Val Asp Arg Phe Cys Leu Phe Val Phe 
465 470 475 480 

Thr Leu Phe Thr He He Ala Thr Val Ala Val Leu Leu Ser Ala Pro 
485 490 495 



His He He Val Gin 
500 
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Patentanspruche 

1 . Nukleinsaure umfassend eine Sequenz ausgewahlt aus 

(a) den Sequenzen gemaG SEQ ID NO: 1, SEQ ID NO: 3 Oder SEQ ID NO: 5, 

(b) zumindest 14 Basenpaare langen Teilsequenzen der unter (a) definierten Sequenzen, 

(c) Sequenzen, welche an die unter (a) definierten Sequenzen hybrdisieren in 2 x SSC bei 60°C, bevorzugt in 
0,5 x SSC bei 60°C, besonders bevorzugt in 0,2 x SSC bei 60°C, 

(d) Sequenzen, welche eine zumindest 70%ige Identitat zu den unter (a) definierten Sequenzen zwischen 
Position 1295 und Position 2195 aus SEQ ID NO: 1 oder zwischen Position 432 und Position 1318 aus SEQ 
ID NO: 3 oder zwischen Position 154 und Position 1 123 aus SEQ ID NO: 5 aufweisen, 

(e) Sequenzen, welche zu den unter (a) definierten Sequenzen komplementar sind und 

(f) Sequenzen, welche aufgrund der Degeneration des genetischen Codes fur dieselbe Aminosduresequenz 
kodieren wie die unter (a) bis (d) definierten Sequenzen. 

2. Vektor umfassend zumindest eine Nukleinsaure gemaG Anspruch 1 . 

3. Vektor nach Anspruch 2, dadurch gekennzeichnet, daG je besagte Nukleinsaure funktionell mit regulatorischen 
Sequenzen verknupft ist, die die Expression der Nukleinsaure in pro- oder eukaryotischen Zellen gewahrleisten. 

4. Wirtszelle enthaltend eine Nukleinsaure gemaG Anspruch 1 oder einen Vektor gemaG Anspruch 2 oder 3. 

5. Wirtszelle nach Anspruch 4, dadurch gekennzeichnet, daf3 es sich urn eine pro- oder eukaryotische Zelle handelt. 

6. Wirtszelle nach Anspruch 5, dadurch gekennzeichnet, daG die prokaryotische Zelle E.coli ist. 

7. Wirtszelle nach Anspruch 5, dadurch gekennzeichnet, daG die eukaryotische Zelle eine Sauger- oder Insektenzelle 
ist. 

8. Polypeptid, welches von einer Nukleinsaure gemaG Anspruch 1 kodiert wird. 

9. Acetylcholinrezeptor umfassend zumindest ein Polypeptid gemaG Anspruch 8. 

10. Verfahren zur Herstellung eines Polypeptids gemaG Anspruch 8 umfassend 

(a) das Kultivieren einer Wirtszelle gemaG einem der AnsprOche 4 bis 7 unter Bedingungen, die die Expression 
der Nukleinsaure gemaG Anspruch 1 gewahrleisten, und 

(b) die Gewinnung des Polypeptids aus der Zelle oder dem Kulturmedium. 

1 1 . Antikdrper, welcher spezif isch mit dem Polypeptid gemaG Anspruch 8 oder dem Rezeptor gemaG Anspruch 9 rea- 
giert. 

12. Transgener Invertebrat enthaltend eine Nukleinsaure gemaG Anspruch 1 . 

13. Transgener Invertebrat nach Anspruch 12. dadurch gekennzeichnet, daG es sich urn Drosophila melanogaster 
Oder Caenorhabditis elegans handelt. 

1 4. Verfahren zur Herstellung eines transgenen Invertebraten gemaG Anspruch 1 2 oder 1 3 umfassend das Einbringen 
einer Nukleinsaure gemaG Anspruch 1 oder eines Vektors gemaG Anspruch 2 oder 3. 

15. Transgene Nachkommen eines Invertebraten gemaG Anspruch 12 oder 13. 
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16. Verfahren zur Herstellung einer Nukleinsaure gemaB Anspruch 1 umfassend die folgenden Schritte: 

(a) Vollstandige chemische Synthese aufan sich bekannte Weise Oder 

(b) chemische Synthese von Oligonukleotiden, Markieren der Oligonukleotide, Hybridisieren der Oligonukleo- 
tide an DNA einer InsektencDNA-Bank, Selektieren von posrtiven Klonen und Isolieren der hybridisierenden 
DNA aus posrtiven Klonen oder 

(c) chemische Synthese von Oligonukleotiden und Amplifizierung der Ziel-DNA mittels PCR. 

17. Regulatorische Region, welche naturlicherweise die Transkription einer Nukleinsaure gemaB Anspruch 1 in Insek- 
tenzellen kontrolliert und eine spezifische Expression gewahrleistet. 

18. Verfahren zum Auffinden neuer Wirkstoffe fQr den Pflanzenschutz, insbesondere von Verbindungen, welche die 
Leitungseigenschaften von Rezeptoren gemaB Anspruch 9 verandern, umfassend die folgenden Schritte: 

(a) Bereitstellen einer Wirtszelle gemaB einem der Anspruche 4 bis 7, 

(b) Kuftivieren der Wirtszelle in der Gegenwart einer Verbindung oder einer Probe, welche eine Vielzahl von 
Verbindungen umfaBt, und 

(c) Detektieren veranderter Rezeptoreigenschaften. 

19. Verfahren zum Auffinden einer Verbindung, die an Rezeptoren gemaB Anspruch 9 bindet. umfassend die folgen- 
den Schritte: 

(a) Inkontaktbringen einer Wirtszelle gemaB einem der Anspruche 4 bis 7, eines Polypeptids gemaB Anspruch 
8 Oder eines Rezeptors gemaB Anspruch 9 mit einer Verbindung oder einem Gemisch von Verbindungen unter 
Bedingungen, die die Interaktion der Verbindung(en) mit der Wirtszelle, dem Polypeptid Oder dem Rezeptor 
erlauben, und 

(b) Bestimmen der Verbindung(en), die spezrfisch an die Rezeptoren binden. 

20. Verfahren zum Auffinden von Verbindungen, die die Expression von Rezeptoren gemaB Anspruch 9 verandern, 
umfassend die folgenden Schritte: 

(a) Inkontaktbringen einer Wirtszelle gemaB einem der Anspruche 4 bis 7 oder eines transgenen Invertebraten 
gemaB Anspruch 1 1 oder 12 mit einer Verbindung oder einem Gemisch von Verbindungen, 

(b) Bestimmen der Rezeptorkonzentration, und 

(c) Bestimmen der Verbindung(en), die die Expression des Rezeptors spezrfisch beeinflussen. 

21. Verwendung zumindest einer Nukleinsaure gemaB Anspruch 1, eines Vektors gemaB Anspruch 2 oder 3, einer 
regulatorischen Region gemaB Anspruch 16 oder eines AntikOrpers gemaB Anspruch 11 zum Auffinden neuer 
Wirkstoffe fur den Pflanzenschutz oder zum Auffinden von Genen, die fur Polypeptide kodieren, welche am Aufbau 
von funktionell ahnlichen Acetylcholinrezeptoren in Insekten beteiligt sind. 
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The invention relates, in particular, to nucleic acids which encode insect acetyl- 
choline receptor subunits. 

Nicotinic acetylcholine receptors are ligand-regulated ion channels which are of im- 
portance in neurotransmission in the animal kingdom. The binding of acetylcholine 
or other agonists to the receptor induces a transient opening of the channel and al- 
lows cations to flow through. It is assumed that a receptor consists of five subunits 
which are grouped around a pore. Each of these subunits is a protein which consists 
of an extracellular N-terminal moiety followed by three transmembrane regions, an 
intracellular moiety, a fourth transmembrane region and a short extracellular C 'ter- 
minal moiety (Changeux et al. 1992). 

Acetylcholine receptors are especially well investigated in vertebrates. In this con- 
text, three groups can be distinguished on the basis of their anatomical location and 
their functional properties (conducting properties of the channel, desensitization, and 
sensitivity towards agonists and antagonists and also towards toxins such as 
a-bungarotoxin). The classification correlates with the molecular composition of the 
receptors. There are heterooligomeric receptors having the subunit composition 
ctjftyo, which are found in muscle (Noda et al. 1982, Claudio et al. 1983, Devillers- 
Thiery et al. 1983, Noda et al. 1983a, b), heterooligomeric receptors which contain 
subunits from the a2 - a6 and B2 - B4 groups and which are found in the nervous 
; system (Wada et al. 1988, Schoepfer et al. 1990, Cockcroft et al. 1991, Heinemann et 
; al. 1997), and also homooligomeric receptors which contain subunits from the a7 - 
: ct9 group and which are likewise found in the nervous system (Lindstrom et al. 1 997, 
| Elgoyhen et al. 1997). This classification is also supported by an examination of the 
frelatedness of the gene sequences of the different subunits. Typically, the sequences 
|of functionally homologous subunits from different species are more similar to each 
iother than are sequences of subunits which are from different groups but from the 



same species. Thus, the rat muscle a subunit, for example, exhibits 78% amino acid 
identity and 84% amino acid similarity with that of the electric ray Torpedo Califor- 
nia but only 48% identity and 59% similarity with the rat ct2 subunit (hetero- 
oligomeric, neuronal) and 36% identity and 45% similarity with the rat a7 subunit 
(homooligomeric, neuronal). Furthermore, the gene sequences of all the known ace- 
tylcholine receptor subunits are to a certain extent similar not only to each other but 
also to those of some other ligand-regulated ion channels (e.g. the serotonin receptors 
of the 5HT 3 type, the GABA-regulated chloride channels and the glycine-regulated 
chloride channels). It is therefore assumed that all these receptors are descended from 
one common precursor and they are classified into one supergene family (Ortells et 
al. 1995). 

In insects, acetylcholine is the most important excitatory neurotransmitter of the cen- 
tral nervous system. Accordingly, acetylcholine receptors can be detected electro- 
physiologically in preparations of insect central nervous system ganglia. The recep- 
tors are detected both in postsynaptic and presynaptic nerve endings and in the cell 
bodies of interneurones, motor neurones and modulatory neurones (Breeretal. 1987, 
Buckingham et al. 1997). Some of the receptors are inhibited by ct-bungarotoxin 
while others are insensitive (SchloB et al. 1988). In addition, the acetylcholine re- 
ceptors are the molecular point of attack for important natural (e.g. nicotine) and 
synthetic insecticides (e.g. chloronicotinyls). 

The gene sequences of a number of insect nicotinic acetylcholine receptors are al- 
ready known. Thus, the sequences of five different subunits have been described in 
Drosophila melanogaster (Bossy et al. 1988, Hermanns-Borgmeyer et al. 1986, 
Sawruk et al. 1990a, 1990b, Schulz et al. Unpublished, EMBL accession number 
Y 15593), while five have likewise been described in Locusta migratoria (Stetzer et 
al. unpublished, EMBL accession numbers AJ000390 - AJ000393), one has been 
described in Schistocerca gregaria (Marshall et al. 1990), two have been described in 
Myzus persicae (Sgard et al. unpublished, EMBL accession number X81887 and 
X81888), and one has been described in Manduca sexta (Eastham et al. 1997). Fur- 



thermore, a number of partial gene sequences from Drosophila melanogaster have 
been characterized as so-called expressed sequence tags (Genbank accession numbers 
AA540687, AA698155, AA697710, AA697326). The fact that individual sequences 
are very similar to those from other insects suggests that these subunits are functional 
homologues. 

It is of great practical importance to make available new insect acetylcholine receptor 
subunits, for example for the purpose of searching for novel insecticides, with those 
subunits which differ from the known subunits to a greater extent than is the case 
between functional homologues being particularly of interest. 

The present invention is consequently based, in particular, on the object of making 
available nucleic acids which encode novel insect acetylcholine receptor subunits. 

This object is achieved by the provision of nucleic acids which comprise a sequence 
selected from 



(a) the sequences according to SEQ ID NO: 1, SEQ ID NO: 3 or SEQ ID NO: 5, 

(b) part sequences of the sequences defined in (a) which are least 1 4 base pairs in 
length, 

(c) sequences which hybridize to the sequences defined in (a) in 2 x SSC at 60°C, 
preferably in 0.5 x SSC at 60°C, particularly preferably in 0.2 x SSC at 60°C 
(Sambrook et al. 1989), 

(d) sequences which exhibit at least 70% identity with the sequences defined in 
(a), between position 1295 and position 2195 in the case of SEQ ID NO: 1, or 
between position 432 and position 1318 in the case of SEQ ID NO: 3, or be- 
tween position 154 and position 1 123 in the case of SEQ ID NO: 5, 



(e) sequences which are complementary to the sequences defined in (a), and 

(f) sequences which, because of the degeneracy of the genetic code, encode the 
same amino acid sequences as the sequences defined in (a) to (d). 

The degree of identity of the nucleic acid sequences is preferably determined using the 
GAP program from the GCG program package, Version 9.1 with standard settings 
(Devereux et al. 1984). 

The present invention is based on the surprising finding that msects possess genes 
which encode subunits of, in particular, homooligomeric acetylcholine receptors. 

The invention furthermore relates to vectors which contain at least one of the novel 
nucleic acids. All the plasmids, phasmids, cosmids, YACs or artificial chromosomes 
which are used in molecular biological laboratories can be used as vectors. These vec- 
tors can be linked to the usual regulatory sequences for the purpose of expressing the 
novel nucleic acids. The choice of such regulatory sequences depends on whether pro- 
karyotic or eukaryotic cells, or cell-free systems, are used for the expression. The 
SV40, adenovirus or cytomegalovirus early or late promoter, the lac system, the trp 
system, the main operator and promoter regions of phage lambda, the control regions 
of the fd coat protein, the 3-phosphoglycerate kinase promoter, the acid phosphatase 
promoter and the yeast a-mating factor promoter are examples of expression control 
sequences which are particularly preferred. 

In order to be expressed, the nucleic acids according to the invention can be introduced 
into suitable host cells. Both prokaryotic cells, preferably E.coli, and eukaryotic cells, 
preferably mammalian or insect cells, are suitable for use as host cells. Other examples 
of suitable unicellular host cells are: Pseudomonas, Bacillus, Streptomyces, yeasts, 
HEK-293, Schneider S2, CHO, COS1 and COS7 cells, plant cells in cell culture and 
also amphibian cells, in particular oocytes. 



The present invention also relates to polypeptides which are encoded by the nucleic 
acids according to the invention and also the acetylcholine receptors, preferably ho- 
mooligomeric acetylcholine receptors, which are synthesized from them. 

In order to prepare the polypeptides which are encoded by the nucleic acids according 
to the invention, host cells which contain at least one of the nucleic acids according to 
the invention can be cultured under suitable conditions. After that, the desired polypep- 
tides can be isolated from the cells or the culture medium in a customary manner. 

The invention furthermore relates to antibodies which bind specifically to the above- 
mentioned polypeptides or receptors. These antibodies are prepared in the customary 
manner. For example, such antibodies can be produced by injecting a substantially im- 
munocompetent host with a quantity of an acetylcholine receptor polypeptide, or a 
fragment thereof, according to the invention which is effective for producing anti- 
bodies, and subsequently isolating these antibodies. Furthermore, an immortalized cell 
line which produces monoclonal antibodies can be obtained in a manner known per se. 
Where appropriate, the antibodies can be labelled with a detection reagent. Preferred 
examples of such a detection reagent are enzymes, radioactively labelled elements, 
fluorescent chemicals or biotin. Instead of the complete antibody, use can also be made 
of fragments which possess the desired specific binding properties. 

The nucleic acids according to the invention can be used, in particular, for producing 
transgenic invertebrates. These latter can be employed in test systems which are based 
on an expression of the receptors according to the invention, or variants thereof, which 
differs from that of the wild type. In addition, this includes all transgenic invertebrates 
in which a change in the expression of the receptors according to the invention, or their 
variants, occurs as the result of modifying other genes or gene control sequences (pro- 
moters). 



The transgenic invertebrates are produced, for example, in Drosophila melanogaster by 
means of P element-mediated gene transfer (Hay et al., 1997) or in Caenorhabditis ele- 
gans by means of transpos on-mediated gene transfer (e.g. using Tel, Plasterk, 1996). 

The invention also consequently relates to transgenic invertebrates which contain at 
least one of the nucleic acid sequences according to the invention, preferably to trans- 
genic invertebrates of the species Drosophila melanogaster or Caenorhabditis elegans, 
and to their transgenic progeny. Preferably, the transgenic invertebrates contain the 

receptors according to the invention in a form which differs from that of the wild type. 

i 

The nucleic acids according to the invention can be prepared in the customary manner. 
For example, the nucleic acid molecules can be synthesized entirely chemically. In 
addition, only short segments of the sequences according to the invention can be syn- 
thesized chemically and these oligonucleotides can be labelled radioactively or with a 
fluorescent dye. The labelled oligonucleotides can be used to screen cDNA libraries 
prepared from insect mRNA. Clones which hybridize to the labelled oligonucleotides 
("positive clones") are selected for isolating the relevant DNA. After the isolated DNA 
has been characterized, the nucleic acids according to the invention are readily ob- 
tained. 

The nucleic acids according to the invention can also be prepared by means of PCR 
methods using chemically synthesized oligonucleotides. 

The nucleic acids according to the invention can be used for isolating and characteriz- 
ing the regulatory regions which occur naturally adjacent to the coding region. Conse- 
quently, the present invention also relates to these regulatory regions. 

The nucleic acids according to the invention can be used to identify novel active com- 
pounds for plant protection, such as compounds which, as modulators, in particular as 
agonists or antagonists, alter the conducting properties of the acetylcholine receptors 
according to the invention. For this, a recombinant DNA molecule, which encompasses 



at least one nucleic acid according to the invention, is introduced into a suitable host 
cell. The host cell is cultured, in the presence of a compound or a sample which com- 
prises a multiplicity of compounds, under conditions which permit expression of the 
receptors according to the invention. A change in the receptor properties can be de- 
tected, as described below in Example 2. Using this approach, it is possible to discover 
insecticidal substances. 



The nucleic acids according to the invention also make it possible to discover com- 
pounds which bind to the receptors according to the invention. These compounds can 
likewise be used as insecticides on plants. For example, host ceils which contain the 
nucleic acid sequences according to the invention and express the corresponding re- 
ceptors or polypeptides, or the gene products themselves, are brought into contact with 
a compound or a mixture of compounds under conditions which permit the interaction 
of at least one compound with the host cells, receptors or the individual polypeptides. 

Host cells or transgenic invertebrates with contain the nucleic acids according to the 
invention can also be used to discover substances which alter the expression of the re- 
ceptors. 

The above-described nucleic acids, vectors and regulatory regions according to the in- 
vention can additionally be used for discovering genes which encode polypeptides 
which are involved in the synthesis, in insects, of functionally similar acetylcholine 
receptors. According to the present invention, functionally similar receptors are under- 
stood as being receptors which encompass polypeptides which, while differing in their 
amino acid sequences from the polypeptides described in this present publication, es- 
sentially possess the same functions. 
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Comments on the sequence listing and the figures: 

SEQ ID NO: 1 shows the nucleotide sequence of the isolated Da7 cDNA, beginning 
with position 1 and ending with position 2886. SEQ ID NO: 1 and SEQ ID NO: 2 
also show the amino acid sequences of the protein deduced from the Da7 cDNA se- 
quence. 

SEQ ID NO: 3 shows the nucleotide sequence of the isolated Hva7-1 cDNA, begin- 
ning with position 1 and ending with position 3700. SEQ ID NO: 3 and SEQ ID NO: 
4 also show the amino acid sequences of the protein deduced from the Hva7-1 cDNA 
sequence. 



SEQ ID NO: 5 shows the nucleotide sequence of the isolated Hva7-2 cDNA, begin- 

15 ning with position 1 and ending with position 3109. SEQ ID NO: 5 and SEQ ID NO: 

i 

6 also show the amino acid sequences of the protein deduced from the Hva7-2 cDNA 
sequence. 

Figure 1 shows the increase in intracellular calcium which occurs in cells which have 
20 been recombinantly modified as described in Example 2 following the addition of 
nicotine. Cells were loaded with Fura-2-acetoxymethyl ester (5-10 jiM in serum- 
free minimal essential medium containing 1% bovine serum albumin and 5 mM cal- 
cium chloride), washed with Tyrode solution buffered with N-(2- 
hydroxyethyl)piperazine-N , -(2-ethanesulphonic acid) (5 mM HEPES) and alternately 
25 illuminated, under a fluorescence microscope (Nikon Diaphot) with light of 340 nm 
and 380 nm wavelength. A measurement point corresponds to a pair of video images 
at the two wavelengths (exposure time per image, 100 ms). The time interval be- 
tween two measurement points is 3 s. After 8 images had been taken (measurement 
point 4.0), nicotine was added to a final concentration of 500 jiM and the measure- 
30 ment series was continued. The fluorescence intensity of the cells when illuminated 



with light of 380 nm wavelength was divided by the corresponding intensity at 340 
nm, thereby giving the ratio. 

Examples: 

Example 1 

Isolating the described polynucleotide sequences 

Polynucleotides were manipulated using standard methods of recombinant DNA 
technology (Sambrook, et al., 1989). The bioinformatic processing of nucleotide and 
protein sequences was carried out using the GCG program package Version 9.1 
(GCG Genetics Computer Group, Inc., Madison Wisconsin, USA). 

Partial polynucleotide sequences 

Sequence comparisons ("Clustalw") were used to identify regions, from which de- 
generate oligonucleotides were deduced by backtranslating the codons, of protein 
sequences from genes whose ability to form homooligomeric acetylcholine receptors 
was known. In all, 5 such oligonucleotide pairs were selected for the polymerase 
chain reaction (PCR). Only one combination (see below) gave a product both from 
Heliothis cDNA and from Drosophila cDNA. 

RNA was isolated from whole Heliothis virescens embryos (shortly before hatching) 
using Trizol reagent (Gibco BRL, in accordance with the manufacturer's instruc- 
tions). The same procedure was adopted with Drosophila embryos (24 h at 25°C). 10 
ug of these RNAs were employed in a first cDNA strand synthesis (Superscript Pre- 
amplification System for first cDNA strand synthesis, Gibco BRL, in accordance 
with the manufacturer's instructions, reaction temperature 45°C). 
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Subsequently, 1/100 of the abovementioned first-strand cDNA was in each case em- 
ployed in a polymerase chain reaction (PCR) using the oligonucleotides alpha7-ls: 
(5'-GAYGTIGAYGARAARAAYCA-3 ') and alpha7-2a: (5 

C YYTCRTCIGCRCTRTTRTA-3 ') (recombinant Taq DNA polymerase, Gibco 
BRL). The PCR parameters were as follows: Hva7-1 and Hva7-2: 94°C, 2 min; 35 
times (94°C, 45 s; 50°C, 30 s; 72°C, 60 s) and also Da7: 96°C, 2 min; 35 times 
(96°C, 45 s; 50°C, 30 s; 72°C, 60 s). In each case, this resulted in a dectable band of 
approx. 0.2 kb in an agarose gel (1%), both in the case of Drosophila cDNA and in 
the case of Heliothis cDNA. After the DNA fragments had been subcloned by means 
of SrfScript (Stratagene), and their sequences had been determined, it turned out that 
two different DNA fragments had been amplified from Heliothis cDNA; these were 
228-1 1 = Hva7-1 (partial, containing 165 bp) and 228-8 = Hva7-2 (partial, containing 
171 bp). Only one DNA fragment was isolated from Drosophila cDNA; this was 
248-5 = Da7 (partial, containing 150 bp). 

Isolating poly A-containing RNA from Heliothis virescens tissue and constructing 
the cDNA libraries 

The RNA for cDNA library I was isolated from whole Heliothis virescens embryos 
(shortly before hatching) using Trizol reagent (Gibco BRL, in accordance with the 
manufacturer's instructions). The RNA for cDNA library II was isolated from whole 
head ganglia from 500 Heliothis virescens larvae (stages 4-5) usings Trizol reagent 
(Gibco BRL, in accordance with the manufacturer's instructions). The poly A-con- 
taining RNAs were then isolated from these RNAs by purifying with Dyna Beads 
280 (Dynal). 5 \ig of these poly A-containing RNAs were subsequently employed in 
constructing cDNA libraries I and II using the A,-ZAPExpress vector (cDNA Syn- 
thesis Kit, ZAP-cDNA Synthesis Kit and ZAP-cDNA Gigapack III Gold Cloning 
Kit, all from Stratagene). In a departure from the manufacturer's instructions, Super- 
script Reverse Transcriptase (Gibco BRL) was used for synthesizing the cDNA at a 
synthesis temperature of 45°C. In addition, radioactively labelled deoxynucleoside 
triphosphates were not added. Furthermore, the synthetisized cDNAs were not frac- 



tionated through the gel filtration medium contained in the kit but instead through 
Size Sep 400 Spun Columns (Pharmacia). 

Complete polynucleotide sequences 

Apart from the first screening round when isolating the Hva7-1 clone, all the screens 
were carried out using the DIG system (all reagents and consumables from 
Boehringer Mannheim, in accordance with the instructions in "The DIG System 
User's Guide for Filter Hybridization", Boehringer Mannheim). The DNA probes 
employed were prepared by means of PCR using digoxigenin-labelled dUTP. The 
hybridizations were carried out at 42°C overnight in DIG Easy Hyb (Boehringer 
Mannheim). Labelled DNA was detected on nylon membranes by means of chemi- 
luminescence (CDP-Star, Boehringer Mannheim) using X-ray films (Hyperfilm MP, 
Amersham). Initial partial sequencing of the isolated gene library plasmids was car- 
ried out, for identification purposes, using T3 and T7 primers (ABI Prism Dye Ter- 
minator Cycle Sequencing Kit, ABI, using an ABI Prism 310 Genetic Analyzer). The 
complete polynucleotide sequences in Hva7-1, Hva7-2 and Da7 were determined, as 
a commissioned sequencing carried out by Qiagen, Hilden, by means of primer 
walking using cycle sequencing. 

a. Isolating the Da7 clone 

10 6 phages from a Drosophila melanogaster cDNA library in X phages (Canton-S 
embryo, 2-14 hours, in Uni-ZAP XR vector, Stratagene) were screened using DIG- 
labelled 248-5 as the probe (in accordance with the manufacturer's (Stratagene) in- 
structions). The maximum stringency when washing the filters was: 0.2 x SSC; 0.1% 
SDS; 42°C; 2x15 min. One clone (clone 432-1) was isolated whose insert had a size 
of 2940 bp (Da7, SEQ ID NO: 1). The largest open reading frame of this sequence 
begins at position 372 of the depicted sequence and ends at position 1822. The 770 
amino acids polypeptide which is deduced from this (SEQ ID NO: 2) has a calculated 
molecular weight of 87.01 kD. 
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b. Isolating the Hva7-1 clone 

10 6 phages from the Heliothis virescens embryo cDNA library (library I) were in- 
cluded in the screening. The first of three screening rounds took place using a- 32 P- 
labelled 228-1 1 DNA as the probe. The probe was hybridized to the filters in Quick- 
hyb (Stratagene) at 68°C for one hour. The filters were then washed twice, for 1 5 min 
on each occasion, at room temperature in 2 x SSC; 0. 1% SDS and twice, for 30 min 
on each occassion, at 42°C in O.lxSSC; 0,1% SDS. Hybridized probes were detected 
by means of autoradiography, at -80°C overnight, using XR X-ray films (Kodak) and 
employing intensifying screens (Amersham). The two further screening rounds were 
carried out using the DIG System (Boehringer Mannheim). 

o 

The clone 241-5, which was isolated in this screen, contained an insert of 3630 bp. 
This insert (Hva7-1, SEQ ID NO: 3) possesses a longest open reading frame "which 
begins at position 335 of the depicted nucleic acid sequence and ends at position 
1821. The 496 amino acids polypeptide which is deduced from this (SEQ ID NO: 4) 
has a calculated molecular weight of 56.36 kD. 

c. Isolating the Hva7-2 clone 

10 6 phages from the Heliothis virescens ganglia cDNA library (library II) were in- 
cluded in the screening. Dig-labelled 228-8 DNA was used as the probe. The maxi- 
mum stringency when washing the filters was: 0.1 x SSC; 0.1% SDS; 42°C; 2 x 15 
min. 

The clone 241-5, which was isolated in this screen, contained an insert of 3630 bp. 
This insert (Hva7-2, SEQ ID NO: 5) possesses a longest open reading frame which 
begins at position 95 of the depicted nucleic acid sequence and ends at position 1598. 
The 501 amino acids polypeptide which is deduced from this (SEQ ID NO: 6) has a 
calculated molecular weight of 56.71 kD. 
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Example 2 

Generating the expression constructs 

a. Da7 

The sequence region from position 372 to position 2681 of SEQ ID NO: 1 was am- 
plified by means of a polymerase chain reaction (PCR). Deoxyoiigonucleotides hav- 
ing the sequences GCGAATTCACCACCATGAAAAATGCACAACTG and 
CGAGACAATAATATGTGGTGCCTCGAG were used for this. The Pfix polymer- 
ase from Stratagene was used as the DNA polymerase in accordance with the manu- 
facturer's instructions. Following the amplification, the segment which had been 
generated was digested with the restriction endonucleases Eco RI and Xho I and 
cloned into a vector, i.e. pcDNA3.1/Zeo (Invitrogen), which had likewise been di- 
gested with Eco RI and Xho I. 

b. Hva7-1 

The sequence region from position 335 to position 1822 from SEQ ID NO: 3 was 
amplified by means of a polymerase chain reaction (PCR). Deoxyoiigonucleotides 
having the sequences 

GCAAGCTTACCACCATGGGAGGTAGAGCTAGACGCTCGCAC and 
GCCTCGAGCGACACCATGATGTGTGGCGC were used for this. The Pfu poly- 
merase from Stratagene was used as the DNA polymerase in accordance with the 
manufacturer's instructions. Following amplification, the generated segment was 
digested with the restriction endonucleases Hindlll and Xho I and cloned into a vec- 
tor, i.e. pcDNA3.1/Zeo (Invitrogen), which had likewise been digested with Hindlll 
and Xho I. 
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c. Hva7-2 

The sequence region from position 95 to position 1597 from SEQ ID NO: 5 was 
amplified by means of a polymerase chain reaction (PCR). Deoxyoligonucleotides 
having the sequences GCAAGCGCCGCTATGGCCCCTATGTTG and 
TTGCACGATGATATGCGGTGCCTCGAGCG were used for this. The Pfu poly- 
merase from Stratagene was used as the DNA polymerase in accordance with the 
manufacturer's instructions. Following amplification, the generated segment was 
digested with the restriction endonucleases Hindlll and Xho I and cloned into a vec- 
tor, i.e. pcDNA3.1/Zeo (Invitrogen), which had likewise been digested with Hindlll 
and Xho I. 

d. Hva7-l / 5HT 3 and Hva7-2 / 5HT 3 chimaeras 

The region from position 335 to position 1036 from SEQ ID NO: 3 (Hva7-1/5HT 3 
chimaera) and the region from position 95 to position 763 from SEQ ID NO: 5 
(Hva7-2/5HT 3 chimaera) was in each case fused to the region from position 778 to 
position 1521 from the Mus museums 5-HT 3 receptor cDNA (sequence in EMBL 
database: M774425) using the method of overlap extension (Jespersen et al. 1997). 
The two fragments were subsequently cloned into the pcDNA3.1/Zeo vector by 
means of TA cloning (Invitrogen, in accordance with the manufacturer's instruc- 
tions). Constructs containing the correct orientation of the two fragments in the vec- 
tor were identified by sequencing using the T7 primer (Invitrogen). 

Cell culture and gene transfer 

HEK293 cells, which express the a subunit of an L-type Ca channel (Zong et al. 
1995, Stetzer et al. 1996), were cultured in Dulbecco's modified Eagle's medium and 
10% foetal calf serum at 5% C0 2 and from 20°C to 37°C. FuGENE 6 (Boehringer 
Mannheim GmbH, Mannheim, Germany) was used for the gene transfer in accor- 
dance with the manufacturer's instructions. At from 24 h to 48 h after the gene trans- 
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fer, the cells were sown at various densities in microtitre plates. Recombinantly al- 
tered cells were selected by growth in Dulbecco's modified Eagle's medium and 
10% foetal calf serum and 150 - 500 ug/ml of Zeocin/ml over a period of from 3 to 4 
weeks. Individual resistant clones were analyzed as described below. 

Fura-2 measurements 

The alterations in the intracellular calcium concentration were measured using Fura- 
2. A stock solution containing 2 mM Fura-2-acetoxy methyl ester (Sigma) in di- 
methyl sulphoxide (DMSO) was diluted to a final concentration of 5 - 10 uM in se- 
rum-free minimal essential medium (MEM, Gibco) containing 1% bovine serum 
albumin and 5 mM calcium chloride. The cells were incubated for from 45 to 60 min 
in this solution in a microtitre plate. The cells were then washed twice in Tyrode so- 
lution buffered with N-(2-hydroxyethyl)piperazine-N'-(2-ethanesulphonic acid) (5 
mM HEPES) (HEPES-buffered salt solution containing 130 mM NaCl, 5 mM KC1, 2 
mM CaCl 2 , 1 mM MgCl 2 , 5 mM NaHC0 3 , 10 mM glucose). 100 ul Tyrode buffer 
were added to the wells of the microtitre plate and the cells were illuminated alter- 
nately, under a fluorescence microscope (Nikon Diaphot), with light of 340 nm and 
380 nm wavelength. A series of video images (exposure time per image 100 ms) 
were taken with pauses of 3 seconds and stored, as digitalized images, in an image 
analysis computer (Leica, Quantimet 570). After 8 images had been taken (measure- 
ment point 4.0 in Fig. 1), nicotine was added to a final concentration of 500 uM and 
the measurement series was continued. The fluorescence intensity of the cells when 
illuminating with light of 380 nm wavelength was divided by the corresponding in- 
tensity at 340 nm and in this way a ratio was formed which represents the relative 
increase in calcium concentration (Grynkiewicz et al. 1985). 



- 16- 



References: 



Bossy et al. (1988) Conservation of neural nicotinic acetylcholine receptors from 
Drosophila to vertebrate central nervous systems, EMBO J. 7, 611-618 

Breer et al. (1987) Molecular properties and functions of insect acetylcholine recep- 
tors, J. Insect Physiol. 33, 771-790 



Buckingham et al. (1997) Imidacloprid actions on insect neuronal acetylcholine re- 
ceptors, J.Exp. Biol. 200, 2685-2692 

Changeux et al. (1992) The functional architecture of the nicotinic acetylcholine re- 
ceptor explored by affinity labelling and site-directed mutagenesis, Quarterly Review 
of Biophysics 25, 395-432 

Claudio et al. (1983) Nucleotide and deduced amino acid sequences of Torpedo cali- 
fornica acetylcholine receptor g subunit, Proc. Natl. Acad. Sci. USA 80, 1 1 1 1-1 1 15 

' Devereux et al. (1984), Nucleic Acids Research 12, 387 

Devillers-Thiery et al. (1983) Complete mRNA coding sequence of the acetyl- 
choline binding a-subunit of Torpedo marmorata acetylcholine receptor: a model for 
the transmembrane organization of the polypeptide chain, Proc. Natl. Acad. Sci. USA 
80, 2067-2071 

Elgoyhen etal. (1997) US Pat No. 5,683,912 

Eastham et al. (1998) Characterisation of a nicotinic acetylcholine receptor from the 
insect Manduca sexta, Eur. J. Neurosci 10, 879-889 



- 17- 



. Grynkiewicz et al. (1985) A new generation of Ca2+ indicators with greatly im- 
proved fluorescence properties, J. Biol. Chem. 260, 3440-3450 

Hay et al. (1997), P element insertion-dependent gene activation in the Drosophila eye, 
Proceedings of The National Academy of Sciences of The United States of America 94 
(10), 5195-5200 

Hermans-Borgmeyer et al. (1986) Primary structure of a developmentally regulated 
nicotinic acetylcholine receptor protein from Drosophila EMBO J. 5, 1503-1508 

Heinemann et al. (1997) US Pat. No 5,591,590 

Jespersen et al. (1997) Efficient Non-PCR-Mediated Overlap Extension of PCR 
Fragments by Exonuclease "End Polishing", Biotechniques, 23, 48-52 

Lindstrom et al. (1997) US Pat. No. 5,599,709 

Marshall et al. (1990) Sequence and functional expression of a single a subunit of an 
insect nicotinic acetylcholine receptor, EMBO J. 9, 4391-4398 

Noda et al. (1982), Primary structure of a-subunit precursor of Torpedo californica 
acetylcholine receptor deduced from cDNA sequence, Nature 299, 793-797 

Noda et al. (1983a), Primary structures of 0- and 5-subunit precursor of Torpedo cali- 
fornica acetylcholine receptor deduced from cDNA sequences, Nature 301, 251-255 

Noda et al. (1983b), Structural homology of Torpedo californica acetylcholine re- 
ceptor subunits, Nature 302, 528-532 

Ortells et al. (1995), Evolutionary history of the ligand-gated ion-channel super- 
family of receptors, Trends in Neurosience 18, 121-127 



- 18- 



• Plasterk (1996), The Tcl/mariner transposon family, Transposable Elements, Current 
Topics in Microbiology and Immunology 204, 125-143 

• Sambrook et al. (1989), Molecular Cloning, A Laboratory Manual, 2nd ed. Cold 
Spring Harbour Press 

Sawruk et al. (1990a), EMBO J. 9, 2671-2677 Heterogeneity of Drosophila nicotinic 
acetylcholine receptors: SAD, a novel developmental^ regulated a-subunit 

Sawruk et al. (1990b), SBD, a novel structural subunit of the Drosophila nicotinic 
acetylcholine receptor, shares its genomic localization with two a-subunits, FEBS 
Lett. 273, 177-181 

SchloB et al. (1988), Neuronal acetylcholine receptors of Drosophila: the ARD pro- 
tein is a component of a high-affinity a-bungarotoxin binding complex, EMBO J. 7, 
2889-2984 

Stetzer et al. (1996) Stable expression in HEK-293 cells of the rat a3/B4 subtype of 
neuronal nicotinic acetylcholine receptor, FEBS Lett. 397, 39-44 

"Zong et al. (1995) On the regulation of the expressed L-type calcium channel by 
cAMP-dependent phosphorylation, Pfltigers Arch. - Eur. J. Physiol. 430, 340-347. 



-19- 

Patent Claims 

1. .^cleic acid which comprises a Sequence sdected from 

, (a) , the sequence* according to SEQ ID NO: 1,' SEQ ID NO: 3 or/ SEQ ID > 
NO: 5, 

(b) parr sequences^hich. are* least 14 base pairs in length, of 'the} se- 
quence^ ^defined under (a), 

(c> - sequence* which hybridize* witn the sequences defined under (a) in 2 x 
SSC at 60°q preferably in 0.5 x SSC at 60°C, particularly preferably 
in 0.2 x SSC at 60°C, 

15 < d > sequence*- which exhibit" at least 70% identity with the sequences de- 

fined under (aj^etween position 1295 and position 2195 from SEQ 
ID NO: 1, or between position 432 and position 1318 from SEQ ID 
NO: 3, or between position 154 and position 1 123 from SEQ ID NO: 
5, 



10 



20 



25 



(e) : ' sequence^ which are. complementary to the sequences defined under 

(a), and 

(f) ^ sequenc<fc}which <6n account of the degeneracy of foe, genetic code, 

encade the same amino acid sequences as. the sequences uefined under 
(a)Io(d), 
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V^ctor according to Claim 2, characterized in that the nucleic acid is func- 
tionally linked ^ regulatory sequence* which ensure^ expression of the nu- 
cleic acid in prokaryotic or eukaryotic cells. 



T$* cell which contains a nucleic acid According to" Claim 1 <or a vector ac- 
cording to Claim 2 or 31 



^ Host cell according to Claim 4, characterized in that it is a prokaryotic or 
eukaryotic cell. 

Hbst cell£ccording tq Claim 5, characterized in that the prokaryotic cell is 
E.colL 

ifost cell according to* Claim 5, characterized in that the eukaryotic cell is a 
mammalian cell or an insect cell. 

Hdlypeptide which is encoded fey a nucleic acid/according t^ Claim 1 . 

^etylcholine receptor which comprises at least one polypeptide according to7 
Claim 8. * 



process for preparing a polypeptide according to Claim 8, which 



comprises! 



(a) culturingj «t host celfraccording 'to one of Claims 4 to Thunder condi- 
tions which ensure the/ expression of the nucleic acid/according to 



Claim l ; and 



(b) isolating the polypeptide from the cell or the culture medium. 



Antibody which reacts specifically with the polypeptide according tc Claim 8 
or the receptor according to Claim %• 



-21- 



TTransgenic fiivertcbrate which contains a nucleic acid According to Claim 1. 

^.iransgexiic invertebrate /according to; Claim 12, characterized in that it is 
Drosophila melanogaster or Caenorhabditis elegans. 

J^ocess for producing a transgenic invertebrate 'according to Claim 12 or 13^ 
which comprises introducing a nucleic acid/according tcf Claim 1 or a vector 
• according to Claim 2or3f. * 

transgenic progeny of an inverteb*ate[according tq Claim 12 /or 13. 

Jfitocess for preparing a nucleic acid (according to, Cfaim 1* which comprises 
the following steps:, - " j 

(a) carrying out an entirely chemical synthesis; in a manner known per se, 
or 

(b) chemically synthesizing oligonucleotide labelling the oligonucleo- 
tide^ hybridizing the oligonucleotide^to the DNA of an insect cDNA 
library, selecting positive clone** and isolating the hybridizing DNA 
from positive cloned or 

(c) chemically synthesizing oligonucleotides? and amplifying the target 
DNA by means of PCR. 

J&gulatory vfegiqif? which naturally controls transcription of fa nucleic acid 
according tq i Claim V in insect cells and ensures: Specific expression, < 



22- 



18. Process for discovering novel active compounds for plant protection, in P ar- 
fi^5 compounds which alter the conducting properties of recepto^ccord- 
ing to Claim 9 . wtgch cdmprises the following steps: 

\ 

(a) providing a hftgt cell according to one of Claims 4 to T 

(b) culturing the ho^ cell in the presence of a compound for a sample 
which comprises ^^multiplicity of compound?, and 

(c) detecting altered rector properties. 

0. ijrocess for discovering a confound which binds to receptors according to 
Claim 9, which encompasses tht following steps: 

(a) bringing a host cell accoro%g to one of Claims 4 to 1, a polypeptide < 
according to Claim S.oWP&ttorg&fdmg to Claim 9/ into contact 
with 8 compound er a mixture of compounds under conditions which 
permit interaction of mefompSund(s> withxthe host cell, the polypep- 
tide or the receptor, and 

(b) determining the. compound^ whig^bind(s) specifically to the recep- 
tors. 



process for discovering compounds which #ter the expression of receptors 
according to Claim 9, which comprises the fol^wing steps: 

(a) bringing a host cell according to one of bairns 4 to 7 or a trafisgenic 
invertebrate .according to Claim 11 or \\ into contact withj^ cprri- 
pound or a mixture of compounds, 



(b) determining the receptor concentration, and 
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(c) deterimping the cori^ound(s) which specifically /influence^ the ex- 
pression of the receptor. 

Use of at least one nucleic acid according to Claim 1, one vector according to 
Claim 2 or 3, one regulatory region atxprding to Claim 16 or one antibody 
according to Claim 1 1 for discovering novel^active compounds for plant pro- 
tection or for discovering genes which encode polypeptides which are in- 
volved in synthesizing functionally similar acetylcholine receptors in insects. 



1 



SEQUENCE LISTING 

<110> Bayer Aktiengesellschaf t 

<120> Nucleic acids which encode 

insect acetylcholine receptor subunits 

<130> Le A 33 020-Foreign Countries 

<140> 

<141> 

<150> DE-198 19 829.9 
<151> 1998-05-04 

<160> 6 

<170> Patentln Ver. 2.1 

<210> 1 
<211> 2886 
<212> DNA 

<213> Drosophila melanogaster 

<220> 
<221> CDS 

<222> (372) . . (2681) 
<400> 1 

ggcacgagaa aaagttgtgg tataaacttt tattgtagga aaacgcataa aaataataga 60 
aaaacgctct tcgggttgta aagaaaataa gaagacaaaa gaaagacatg aaaacgttgc 120 



aaacaataaa gcatatactt gccatattga tataaaggga aatcgtgaaa aggcggtgaa 180 

aatttcgtaa gattagttgg tattaagggc agcccatgca cacagctaaa aagggaacta 24 0 

aaaaaacccc gcacagaaca atgaaagctg cagcagctgg ataaggccga caaaaccgaa 3 00 

aattatatta ttgtaatcta gtagagagca gacaacatat ccgctggcaa caaccaacac 3 60 

cgaaagagac t atg aaa aat gca caa ctg aaa ctg act gaa gtt gac gat 410 
Met Lys Asn Ala Gin Leu Lys Leu Thr Glu Val Asp Asp 
15 10 

gat gag ctg tgg ctg gca gta aga tta gcg cac tgc age age aac ttt 458 
Asp Glu Leu Trp Leu Ala Val Arg Leu Ala His Cys Ser Ser Asn Phe 
15 20 25 

age age agt age age aca aga ace ace age age aac cag agg cac aac 5 06 
Ser Ser Ser Ser Ser Thr Arg Thr Thr Ser Ser Asn Gin Arg His Asn 
30 35 40 45 

cag caa etc aca aca ctg caa cca agg age tta agt aca aaa cac cac 554 
Gin Gin Leu Thr Thr Leu Gin Pro Arg Ser Leu Ser Thr Lys His His 
50 55 60 



age aac att gca age gag cag cac aat age cag caa cag gag cca gca 602 
Ser Asn lie Ala Ser Glu Gin His Asn Ser Gin Gin Gin Glu Pro Ala 
65 70 75 



teg aag gac gag gat gta gee aac cac ggt aga age aat gac cag cag 
Ser Lys Asp Glu Asp Val Ala Asn His Gly Arg Ser Asn Asp Gin Gin 



650 



Asp Arg Val Ser Thr Ala Thr Phe Ala Trp Val Leu His Val Leu Gin 
210 215 220 



gtg ctg etc gtg teg ctg caa cag tgg caa ctt cac gtg caa cag cga 
Val Leu Leu Val Ser Leu Gin Gin Trp Gin Leu His Val Gin Gin Arg 
225 230 235 

teg gtg eta ctg ttc aga agg ate gca gcg age ace ate gee ttc att 
Ser Val Leu Leu Phe Arg Arg lie Ala Ala Ser Thr lie Ala Phe lie 
240 245 250 



tec tat tta ggc age ttt gca gcg caa ctg aaa aat age age age age 
Ser Tyr Leu Gly Ser Phe Ala Ala Gin Leu Lys Asn Ser Ser Ser Ser 
255 260 265 

agt age age age aac age age aac aac age age acg caa ata tta aac 
Ser Ser Ser Ser Asn Ser Ser Asn Asn Ser Ser Thr Gin lie Leu Asn 
270 275 280 285 



gga ctt aat aaa 
Gly Leu Asn Lys 

tct get aaa gtt 
Ser Ala Lys Val 
305 

gat ctt ttg gat 
Asp Leu Leu Asp 



cac tea tgg ata 
His Ser Trp lie 
290 

tgc eta gca gga 
Cys Leu Ala Gly 

cct tat aat aca 
Pro Tyr Asn Thr 



ttt tta ttg ata 
Phe Leu Leu lie 
295 

tat cat gaa aag 
Tyr His Glu Lys 
310 

eta gaa cgt ccc 
Leu Glu Arg Pro 



tat ttg aat tta 
Tyr Leu Asn Leu 
300 

aga ctg tta cac 
Arg Leu Leu His 
315 

gtt etc aat gaa 
Val Leu Asn Glu 



teg gac ccg tta caa tta age ttt ggt tta act tta atg caa att ate 1418 
Ser Asp Pro Leu Gin Leu Ser Phe Gly Leu Thr Leu Met Gin He He 
335 340 345 

gat gtg gac gag aaa aat caa ttg eta gtc act aat gtg tgg tta aaa 14 66 
Asp Val Asp Glu Lys Asn Gin Leu Leu Val Thr Asn Val Trp Leu Lys 
350 355 360 365 

ctg gag tgg aac gac atg aat etc cgc tgg aac ace tec gac tat ggc 1514 
Leu Glu Trp Asn Asp Met Asn Leu Arg Trp Asn Thr Ser Asp Tyr Gly 
37 <> 375 380 

gga gtt aag gat ctg cga ata ccg ccg cat cgc ate tgg aag ccg gac 1562 
Gly Val Lys Asp Leu Arg He Pro Pro His Arg He Trp Lys Pro Asp 
385 390 395 

gtg ctg atg tac aac agt gcg gat gag gga ttt gac ggc ace tac cag 1610 
Val Leu Met Tyr Asn Ser Ala Asp Glu Gly Phe Asp Gly Thr Tyr Gin 
400 405 410 

acg aac gtg gtg gtg egg aac aac ggc teg tgt eta tac gtt ccg ccg 1658 
Thr Asn Val Val Val Arg Asn Asn Gly Ser Cys Leu Tyr Val Pro Pro 
415 420 425 

ggg ate ttc aag teg acg tgc aag ate gac ate acg tgg ttc ccc ttc 1706 
Gly He Phe Lys Ser Thr Cys Lys He Asp He Thr Trp Phe Pro Phe 



43 0 435 440 



445 



gat gac cag egg tgc gag atg aag ttc ggc agt tgg ace tac gac gga 
Asp Asp Gin Arg Cys Glu Met Lys Phe Gly Ser Trp Thr Tyr Asp Gly 
450 455 460 



1754 



ttc cag ctg gat tta caa tta caa gat gaa act ggc ggt gat ate age 
Phe Gin Leu Asp Leu Gin Leu Gin Asp Glu Thr Gly Gly Asp He Ser 
465 470 475 



1802 



agt tac gtg etc aac ggc gag tgg gaa eta ctg ggt gtg ccc ggc aaa 1850 
Ser Tyr Val Leu Asn Gly Glu Trp Glu Leu Leu Gly Val Pro Gly Lys 
480 485 490 

cgt aac gag ate tat tac aac tgc tgc ccg gaa ccc tat ata gac ate 1898 
Arg Asn Glu He Tyr Tyr Asn Cys Cys Pro Glu Pro Tyr He Asp He 
495 500 505 

acc ttc gee ate ate ate cgc cga cga aca ctg tac tat ttc ttc aac 1946 
Thr Phe Ala He He He Arg Arg Arg Thr Leu Tyr Tyr Phe Phe Asn 
510 515 520 525 

ctg ate ata cct tgt gta ctg att gec tec atg gec ttg etc gga ttc 1994 
Leu He He Pro Cys Val Leu He Ala Ser Met Ala Leu Leu Gly Phe 
530 535 540 

acc ctg ccg cca gat teg ggt gaa aaa tta teg ctg ggt gtt acc ate 2 042 
Thr Leu Pro Pro Asp Ser Gly Glu Lys Leu Ser Leu Gly Val Thr He 
545 550 555 

ttg etc teg ctg acc gtg ttt ctg aat atg gtt gee gag aca atg ccg 2090 
Leu Leu Ser Leu Thr Val Phe Leu Asn Met Val Ala Glu Thr Met Pro 
560 565 570 

get act tec gat gcg gtg cca ttg tgg ata cgc ate gtg ttt ttg tgc 213 8 
Ala Thr Ser Asp Ala Val Pro Leu Trp He Arg He Val Phe Leu Cys 



575 

tgg ctg cca 
Trp Leu Pro 
590 

eta gag ttc 
Leu Glu Phe 

cac cag ata 
His Gin lie 

ctg ctg gec 
Leu Leu Ala 
640 

cgc ccc atg 
Arg Pro Met 
655 

cgc acg gtt 
Arg Thr Val 
670 

age acc cga 
Ser Thr Arg 



tgg ata ttg 
Trp lie Leu 
595 

ccg acc acg 
Pro Thr Thr 
610 

etc tec gac 
Leu Ser Asp 
625 

aac gta eta 
Asn Val Leu 

acg ccc ggc 
Thr Pro Gly 

tat gga caa 
Tyr Gly Gin 
675 

atg ccg gat 
Met Pro Asp 
690 



580 

cga atg agt 
Arg Met Ser 

ccc tgt teg 
Pro Cys Ser 

gtt gag ctg 
Val Glu Leu 
630 

gac ate gat 
Asp lie Asp 
645 

gga aca ctg 
Gly Thr Leu 
660 

ggc gac gat 
Gly Asp Asp 

gcg gtc acc 
Ala Val Thr 



585 

cgc cca gga 
Arg Pro Gly 
600 

gac aca tec 
Asp Thr Ser 
615 

aaa gag cgc 
Lys Glu Arg 

gat gac ttc 
Asp Asp Phe 

cca cac aac 
Pro His Asn 
665 

ggc age att 
Gly Ser lie 
680 

cat cat acg 
His His Thr 
695 



cga ccg ctg 
Arg Pro Leu 

tec gag egg 
Ser Glu Arg 
620 

teg teg aaa 
Ser Ser Lys 
635 

egg cac aat 
Arg His Asn 
650 

ccg get ttc 
Pro Ala Phe 

ggg cca att 
Gly Pro lie 

tgc ate aaa 
Cys lie Lys 
700 



ate 2186 
He 
605 

aag 2234 
Lys 

teg 2282 
Ser 

tgt 2330 
Cys 

tat 2378 
Tyr 

ggc 2426 
Gly 
685 

tea 2474 
Ser 



t gaa tat gaa tta ggt tta ate tta aag gaa att cgc ttt ata 2522 



Ser Thr Glu Tyr Glu Leu Gly Leu He Leu Lys Glu He Arg Phe He 
7 °5 710 715 

act gat cag eta cgt aaa gat gac gag tgc aat gac att gec aat gat 2570 
Thr Asp Gin Leu Arg Lys Asp Asp Glu Cys Asn Asp He Ala Asn Asp 
720 725 730 

tgg aaa ttt gca get atg gtc gtt gac aga ctg tgc ctt ate ata ttc 2618 
Trp Lys Phe Ala Ala Met Val Val Asp Arg Leu Cys Leu He He Phe 
735 740 745 

aca atg ttc gca ata tta gee aca ata get gta eta eta teg gca cca 2666 
Thr Met Phe Ala He Leu Ala Thr He Ala Val Leu Leu Ser Ala Pro 
750 755 7 60 765 

cat att att gtc teg tagecatatg ggcgaggtgg ttattgttat tggttttatt 2721 
His He He Val Ser 
770 

ataaaatcaa tttgttaatt attaaattaa taacgaaact ctttaagtaa attaaaacta 2781 
aaaagacact aaaaaagcac aaaaaaatag gaaaatacat gataaaaccc atgaactaaa 2841 



taatacatcc aagaaaaacc aaaacaaaaa aaaaaaaaaa aaaaa 



2886 



<210> 3 
<211> 3701 
<212> DNA 

<213> Heliothis virescens 



<220> 
<221> CDS 

<222> (335) . . (1822) 



<400> 3 

ggcacgagcc gctgccccac ggtcggccgc actccgctga acaacaatgc tcaaaaacac 60 

gccgtgactc cacacacatc ccctcggcgc agtaggcgat gtttgaggat cggacggcac 120 

gcgtggccgt cggcgagcgg tcgtgaacaa gttgcataca tatgaaaacc gtaaaaagat 180 

tgaattttaa gccgatcgtg ttcgatagat cctaatagag aagcgggagt gcggcgtttg 240 

gtaggcgggg gtcgagtcgc gcggtcgggg gaaatggcgc ggcgcggggc ggcggcggcg 300 

gcggcgcgcg gcgcggcggc gtcgcggcgc tgac atg ggc ggg egg gcg cgc cgc 355 

Met Gly Gly Arg Ala Arg Arg 
1 5 

teg cac ttg gcg gcg ccc gcg ggc ctg ctg ctg ctg ctg tgc ctg etc 403 
Ser His Leu Ala Ala Pro Ala Gly Leu Leu Leu Leu Leu Cys Leu Leu 
10 15 20 

tgg ccg agg ggg g Ca cgc tgc ggg tac cac gag aag egg eta ctg cac 451 
Trp Pro Arg Gly Ala Arg Cys Gly Tyr His Glu Lys Arg Leu Leu His 
25 30 35 



cac eta ttg gac cac tac aac gta ctg gag agg ccc gtc gtc aac gag 
His Leu Leu Asp His Tyr Asn Val Leu Glu Arg Pro Val Val Asn Glu 
40 45 50 55 



499 



age gac ccg ctg cag etc tec ttc ggc etc acg etc atg cag ate ate 54 7 
Ser Asp Pro Leu Gin Leu Ser Phe Gly Leu Thr Leu Met Gin lie lie 
60 65 70 

gac gtg gac gag aag aac cag ctt tta ata aca aac ate tgg eta aaa 595 
Asp Val Asp Glu Lys Asn Gin Leu Leu lie Thr Asn He Trp Leu Lys 
75 80 85 

eta gag tgg aat gat atg aac ttg agg tgg aac act tea gat ttc ggc 643 
Leu Glu Trp Asn Asp Met Asn Leu Arg Trp Asn Thr Ser Asp Phe Gly 
90 95 100 

ggg gtc aaa gat tta aga gtg cca ccc cac aga eta tgg aaa cca gac 691 
Gly Val Lys Asp Leu Arg Val Pro Pro His Arg Leu Trp Lys Pro Asp 
105 110 115 

gtc ctt atg tac aac age gcg gac gaa ggg ttc gac age acg tat cca 73 9 
Val Leu Met Tyr Asn Ser Ala Asp Glu Gly Phe Asp Ser Thr Tyr Pro 
120 125 130 135 

acg aac gtg gtg gtg egg aac aac ggc teg tgt ctg tac gtg ccg ccc 787 
Thr Asn Val Val Val Arg Asn Asn Gly Ser Cys Leu Tyr Val Pro Pro 
140 145 150 



ggc ate ttc aag age acc tgc aag ate gac ate acc tgg ttc ccc ttc 
Gly He Phe Lys Ser Thr Cys Lys He Asp He Thr Trp Phe Pro Phe 



835 



A. A 



155 160 



165 



gac gac caa cga tgc gag atg aag ttt ggc age tgg act tat gat ggt 883 
Asp Asp Gin Arg Cys Glu Met Lys Phe Gly Ser Trp Thr Tyr Asp Gly 
170 175 180 

tat cag ttg gat eta caa eta cag gat gaa ggg ggc gga gat ata age 931 
Tyr Gin Leu Asp Leu Gin Leu Gin Asp Glu Gly Gly Gly Asp lie Ser 
185 190 195 

agt ttt gtc acg aat ggc gaa tgg gag tta ata gga gtc ccc ggc aag 979 
Ser Phe Val Thr Asn Gly Glu Trp Glu Leu He Gly Val Pro Gly Lys 
200 205 210 215 

cgc aac gag ate tac tac aac tgt tgt ccg gag cca tac ate gac ate 1027 
Arg Asn Glu He Tyr Tyr Asn Cys Cys Pro Glu Pro Tyr He Asp He 
220 225 230 

acg ttt gcg gtg gtg ate egg agg aaa acg etc tac tac ttc ttc aat 1075 
Thr Phe Ala Val Val He Arg Arg Lys Thr Leu Tyr Tyr Phe Phe Asn 
235 240 245 

ctg ate gtg ccc tgc gtg etc ate gee tec atg get eta ttg ggg ttc 1123 
Leu He Val Pro Cys Val Leu He Ala Ser Met Ala Leu Leu Gly Phe 
250 255 260 

ace ttg cct cca gac tec gga gaa aag ttg tct tta ggt gtg acg ata 1171 
Thr Leu Pro Pro Asp Ser Gly Glu Lys Leu Ser Leu Gly Val Thr He 
265 270 275 



tta ctg teg ttg acg gtg ttc etc aac atg gtg gcg gag acg atg cca 



1219 



Leu Leu Ser Leu Thr Val Phe Leu 
280 285 

gcg acg teg gac gec gtg ccc ttg 
Ala Thr Ser Asp Ala Val Pro Leu 
300 



Asn Met Val Ala Glu Thr Met Pro 
290 295 

etc ggc acc tac ttc aac tgc ate 12 67 
Leu Gly Thr Tyr Phe Asn Cys lie 
305 310 



atg ttc atg gtg get tec tec gtc gtc tec acc ata ctg ate etc aac 1315 
Met Phe Met Val Ala Ser Ser Val Val Ser Thr He Leu He Leu Asn 
315 320 325 

tac cac cac egg cac gca gac act cac gaa atg agt gat tgg att cgt 13 63 
Tyr His His Arg His Ala Asp Thr His- Glu Met Ser Asp Trp He Arg 
330 335 340 

tgc gtg ttc ctt tat tgg ctg ccg tgg gtg ctg cgc atg tea egg ccc 1411 
Cys Val Phe Leu Tyr Trp Leu Pro Trp Val Leu Arg Met Ser Arg Pro 
345 350 355 



ggc teg gcg acg acg ccg ccg ccg gcg cgc gta cct ccg ccg ccg gac 14 59 
Gly Ser Ala Thr Thr Pro Pro Pro Ala Arg Val Pro Pro Pro Pro Asp 
360 365 370 375 

ctg gag ctg cgc gag cgc tec tec aag teg etc eta gcg aac gtg etc 1507 
Leu Glu Leu Arg Glu Arg Ser Ser Lys Ser Leu Leu Ala Asn Val Leu 
380 385 390 

gac ate gat gac gac ttc cgc cac ccg caa gcg cag cag ccg caa tgc 1555 
Asp He Asp Asp Asp Phe Arg His Pro Gin Ala Gin Gin Pro Gin Cys 
395 400 405 



tgc cga tac tac agg ggg ggt gag gag aat ggc gcg ggg ttg gcg gcg 1603 
Cys Arg Tyr Tyr Arg Gly Gly Glu Glu Asn Gly Ala Gly Leu Ala Ala 
410 415 420 

cac agt tgc ttc ggt gtc gac tac gag etc tec etc att ctg aag gag 1651 
His Ser Cys Phe Gly Val Asp Tyr Glu Leu Ser Leu He Leu Lys Glu 
425 430 435 

att aga gtc ate aca gat cag atg cgc aag gac gac gaa gat gcg gac 1699 
He Arg val He Thr Asp Gin Met Arg Lys Asp Asp Glu Asp Ala Asp 

440 445 450 455 

att teg cgc gac tgg aag ttc gec gee atg gtc gtg gac aga ctg tgc 1747 
He Ser Arg Asp Trp Lys Phe Ala Ala Met Val Val Asp Arg Leu Cys 
460 465 470 

ctt att ate ttt acc ctg ttc aca ate ate gee acg eta gec gtg ctg 1795 
Leu He He Phe Thr Leu Phe Thr He He Ala Thr Leu Ala Val Leu 
475 480 485 

ctg tec gcg cca cac ate atg gtg teg tagcgacccg cccgcttgcg i 8 42 
Leu Ser Ala Pro His He Met Val Ser 
490 495 

gataegcatg cgaaaagttc tgtgataccg cgaatatttg ttaagttgtg atgagcgaag 1902 

tggegeggae ggtgacgccg eggegtegga gttgccgccg cctgcctcgc cgcccgcgcc 1962 

cccctgtaga cataagttac cgctgactgc caaccctgta cgttcaacaa ataactgccc 2022 

ateegaetaa egtcttttat eeeettgaaa aattcagega ttgtgtaccc ctttetteca 2082 



agaatacaat gacaaatggt cgtcacgctc agtggaatca atcccgtact cttcgcccga 2142 
tatttccctt agggtatgtc acgagtttga atgagcggtt ccgtatcaga cgttccgtcc 2202 
ccggaacggt cgtcccctgc gataaagtgg cagtacgtgc tatacaggca cttaaggccg 2262 
ccacgccacg gcgccgcggt gcgctcgggc cgcgaacccg cgaccctcac cgctgcaagt 2322 
ggccacccac tagacaagac tgcggcagaa aatatttgca caaaaacgtc ttccttctta 2 3 82 
ccgatgaacg acctgattcg catttaaaat taaactttgt tagaacttct tcgattcttg 2442 
aaatctattg tacagtttag agtttgggcg gtgaaacaat ggccctttgt ttccttcttg 2502 
ttcgattcca tgaatcgtgg ttataatccc tagttttatt ttcggatata tttgtgtcag 2562 
tagctagtat agaactttac aaacaatgtt gattcaattg gtacaggttg tgatatgcct 2622 
cgttgtgaac gggtccgata ttgttataaa tggtaaaata cccatggcta tagcttaata 2 682 
aatcgttcgt taaaagttgt agttaaacaa atattatttt aataaagtca tatctgggtc 2742 
ttccggaacg acttttacaa ataattaaat tacatattaa tatcacgttt gtacttcttt 2 802 
ccatacagtt acagtaattc gtatgctgaa aataatatta gcttgtaaaa ttttcttctt 2 862 
cgaaaattta ttcaaacaga tgcgaccatc gtttcaaaca tttacatgta atatagaact 2 922 
cattttataa gatatacaac attttataag tacaagaagt tgtaacatga accggttttt 2 982 



cgttacatag agggtataac acaaaggtgc ctacatattg acagatgcga agcacgatca 3042 
gttgataagc acaggtacac tatatcctga catccgacag tcctgccgct cgtctgccac 3102 
actcggaaac attcgacagt tcagtttact gctccgccat catcgattgt taagtttgtt 3162 
gttctaactc atcgcattca tttcattcaa aaacattgta aacctctcaa ggggaaaacg 3222 
tgttgtaaac agtgagagtg cgcgggtaca accgacacgc gaatgtaccc tcgcaaggct 3282 



cctgtaatgt tttcctcttc cgaggtgttg ctgagagtaa tcttagacgg tccgatggaa 3342 
gttgcggacc ggatatgatt acaagtcaat gtttttaagt catccgttta tttattgtta 3402 
tatcttctta ccattcgcta gaggttgtgt gacgacccgg acggtgggcg ccgcaacccg 3462 



cacacgcggg gttccatctt tgtattagat ggaagttgtg cggcatctct ccgtcggcaa 3 522 
tgggacaacc cgttgtcccc aacatttgtt caattgttag ggttaactct gaattgcact 3582 
ttgtttatta aatataaacg aatgaaacaa aaaaaaaaaa aaaaaactcg agagtacttc 3 642 



tagagcggcc gcgggcccat cgattttcca cccgggtggg gtaccargta agtgtaccc 3701 



<211> 3109 
<212> DNA 

<213> Heliothis virescens 

<220> 

<221> CDS 

<222> (95) . . (1597) 

<400> 5 

ggcacgagcc ggccgcacgt tgtcccaggc cgcatgagcg cgccggcgtg ctagcgcagc 60 

gtgcgcgggt gtggtatgcc cgcgcgtcgc cgct atg gcc cct atg ttg gcg gcc 115 

Met Ala Pro Met Leu Ala Ala 
1 5 

ttg gcg ctg ctg get ttg ctg ccc gta teg gag caa ggt cct cac gag 163 
Leu Ala Leu Leu Ala Leu Leu Pro Val Ser Glu Gin Gly Pro His Glu 
10 15 20 

aag aga etc ctg aac gcg ttg ctg gcg aac tac aac ace ctg gag cga 211 
Lys Arg Leu Leu Asn Ala Leu Leu Ala Asn Tyr Asn Thr Leu Glu Arg 
25 30 35 

ccg gtg gcc aac gag age gaa ccg eta gag gtc agg ttc ggc ttg ace 25 9 
Pro Val Ala Asn Glu Ser Glu Pro Leu Glu Val Arg Phe Gly Leu Thr 
40 45 50 55 



ttg cag caa ate att gac gtg gac gag aag aat caa eta ctt ata ace 3 07 



Leu Gin Gin lie He Asp Val Asp Glu Lys Asn Gin Leu Leu He Thr 
60 65 70 

aat ata tgg ctg teg ttg gag tgg aat gac tac aac ctg agg tgg aac 355 
Asn He Trp Leu Ser Leu Glu Trp Asn Asp Tyr Asn Leu Arg Trp Asn 
75 80 85 

gac age gag tat ggc ggg gtc aag gac etc agg ate acg ccc aac aag 403 
Asp Ser Glu Tyr Gly Gly Val Lys Asp Leu Arg He Thr Pro Asn Lys 
90 95 100 

ttg tgg aag ccg gac gtc ctt atg tat aat agt get gac gag ggt ttt 451 
Leu Trp Lys Pro Asp Val Leu Met Tyr Asn Ser Ala Asp Glu Gly Phe 
105 110 115 

gac ggg acc tac cag acc aac gtg gtg gtc aga age ggc ggc agt tgc 499 
Asp Gly Thr Tyr Gin Thr Asn Val Val Val Arg Ser Gly Gly Ser Cys 
120 125 130 135 

ctg tac gtg cca cct ggc ata ttc aag age aca tgc aag atg gac ate 54 7 
Leu Tyr Val Pro Pro Gly He Phe Lys Ser Thr Cys Lys Met Asp He 
140 145 150 

gcg tgg ttt ccc ttc gac gac caa cac tgt gat atg aag ttc ggt age 595 
Ala Trp Phe Pro Phe Asp Asp Gin His Cys Asp Met Lys Phe Gly Ser 
i55 160 165 



tgg aca tat gac ggc aat cag ttg gat ctg gtg eta aaa gat gag gca 
Trp Thr Tyr Asp Gly Asn Gin Leu Asp Leu Val Leu Lys Asp Glu Ala 
l" 70 175 180 



643 



ggc ggc gat eta teg 
Gly Gly Asp Leu Ser 
185 

gga atg cca ggc aaa 
Gly Met Pro Gly Lys 
200 



gac ttc ata aca aat ggg 
Asp Phe He Thr Asn Gly 
190 

aag aac aca ata aca tac 
Lys Asn Thr He Thr Tyr 
205 210 



gag tgg tat eta ata 691 

Glu Trp Tyr Leu He 

195 

gcg tgc tgc ccc gag 73 9 
Ala Cys Cys Pro Glu 
215 



ccc tac gtg gac gtc acc ttc acc ate atg ata aga aga cga acc ttg 787 
Pro Tyr Val Asp Val Thr Phe Thr He Met He Arg Arg Arg Thr Leu 
220 225 230 

tac tac ttc ttc aac ctg ate gtc ccg tgc gtg ctg ate tea teg atg 835 
Tyr Tyr Phe Phe Asn Leu He Val Pro Cys Val Leu He Ser Ser Met 
235 240 245 

gca etc etc ggc ttc aca ctg cca cca gac tec gga gag aaa etc aca 883 
Ala Leu Leu Gly Phe Thr Leu Pro Pro Asp Ser Gly Glu Lys Leu Thr 
250 255 260 



ctt gga gtc act att ctt eta teg ctg acg gtg ttc etc aac ctg gta 931 
Leu Gly Val Thr He Leu Leu Ser Leu Thr Val Phe Leu Asn Leu Val 
265 270 275 



gee gag acc ctg cca cag gtc tec 
Ala Glu Thr Leu Pro Gin Val Ser 
280 285 

tac ttc aat tgc ate atg ttc atg 
Tyr Phe Asn Cys He Met Phe Met 
300 



gac get ate ccc ctg tta ggg acg 979 
Asp Ala He Pro Leu Leu Gly Thr 
290 295 

gta gcg teg tct gtg gta ctg act 1027 
Val Ala Ser Ser Val Val Leu Thr 
305 310 



gtg gtg gta etc aat tac cac cat cga aca get gat ata cat gaa atg 1075 
Val Val Val Leu Asn Tyr His His Arg Thr Ala Asp He His Glu Met 
315 320 325 



cca cag tgg ata aaa tea gta ttc eta caa tgg ttg cca tgg ata ctg 1123 
Pro Gin Trp He Lys Ser Val Phe Leu Gin Trp Leu Pro Trp He Leu 
330 335 340 

cga atg teg agg cca ggg aag aag ate ace agg aag act ata atg atg 1171 
Arg Met Ser Arg Pro Gly Lys Lys He Thr Arg Lys Thr He Met Met 
345 350 355 

aac acg agg atg agg gag ctg gaa ctg aag gag agg teg teg aag tec 1219 
Asn Thr Arg Met Arg Glu Leu Glu Leu Lys Glu Arg Ser Ser Lys Ser 
360 365 370 375 

ttg ctg gcg aat gtt eta gat att gat gat gac ttc aga cac ggc cct 12 67 
Leu Leu Ala Asn Val Leu Asp He Asp Asp Asp Phe Arg His Gly Pro 
380 385 390 

ccg cct cct aac agt act gec teg ace ggg aat ttg gga cct ggg tgc 1315 
Pro Pro Pro Asn Ser Thr Ala Ser Thr Gly Asn Leu Gly Pro Gly Cys 
395 400 405 

tea ata ttc cgc acg gat ttc cgt egg teg ttc gtc cgt ccg tec acg 13 63 
Ser He Phe Arg Thr Asp Phe Arg Arg Ser Phe Val Arg Pro Ser Thr 
410 415 420 

atg gaa gac gtg ggc ggc ggg ctg ggt age cac cat cgc gag ctg cac 1411 
Met Glu Asp val Gly Gly Gly Leu Gly Ser His His Arg Glu Leu His 



425 430 435 

etc at a ctg aga gag ctg cag ttc ate acg gee agg atg aag aag get 1459 
Leu lie Leu Arg Glu Leu Gin Phe lie Thr Ala Arg Met Lys Lys Ala 
440 445 450 455 

gat gag gaa gec gag ctg ate age gac tgg aag ttt get gcg atg gtt 1507 
Asp Glu Glu Ala Glu Leu lie Ser Asp Trp Lys Phe Ala Ala Met Val 
460 465 470 

gtt gat agg ttt tgc ctg ttc gtg ttc aca ctt ttc aca ate ate gcg 1555 
Val Asp Arg Phe Cys Leu Phe Val Phe Thr Leu Phe Thr He He Ala 
475 480 485 

aca gta get gtc ctg tta teg gca ccg cat ate ate gtg caa 1597 
Thr Val Ala Val Leu Leu Ser Ala Pro His He He Val Gin 
490 495 500 

tgaaccaacc actgagcegg caactccggc gcatgaatga gagaaataat tattagatcg 1657 

ccgatttgta attataattg ataatgtaat taaattaaat acgtggttga aacgcacacg 1717 

tctccataac aaagtcttaa gacattaaat tatgataaat ttacatattg tagttaagtc 1777 

gagtgttgat ggaaatttta gccggcgcaa ggagtttcgt gaaggtctgt atatattttt 1837 

tcttattgtt gtatattgta tcgttgttca tgttttcttt caggaagtga gctttgtact 1897 

gtttgtttct tcgatggcag gtgeacttea gttcaggctg aaatttccat taacatttat 1957 



gtgatgttga ctaggatgtt atacagataa atgttgacgt gtataatttg 2017 



ttaaaataaa caatattaat tactattact aaacgatatt ataaacgaag tactaacgag 2077 
ggttacttta atgggaagaa cgctaagctg gcacagagtt gcattaattt gaaaaaagaa 213 7 
attacggaaa aaagtttatt gaaaattgaa ctttttggaa ggaaagtaac gtttgatcaa 2197 
aaaagtttgt aaaacgaaag ttcggttctg cgccaatact ggaattaaaa ttctcgtaaa 2257 
tattagggaa aagaaggtcc tttaaaacaa aagatttgaa ccggcatcct ttttacaagt 2 317 
aatgagggat cacagatgat gacaaaaaac cttagggtat ataagtaatg tacataatgg 23 77 
atcaaatatc ggtagagtca agaatagtta acgatttaag attattccat tcgatattaa 243 7 
aattcgatta gcgattgtcg ctgcgtctac tttgatacat atcgatttga atcgatattg 2497 
tataaattta gatagatcgg acattagtaa tgagtatgga cgttttaatt tttaaaaaag 2557 
aatgtactac gaagattaaa tccaggaatt gttaaacagt tatggaattg ataagaaatc 2617 
aacaattaat acggaaccaa aggtagacta ggtgtagcat caggagattg aattaaaaca 2677 
taaattagga ccgacttaaa tggaacttgc gagtgtattg ataacttttt aatttaaaaa 2 73 7 
ctcattgtcg attaaatgga gaataacttt tgatctctcg tatcgataaa tgctcactta 2797 
actatcgata gcgtaatatt ataactgtta gtatatcgat atgggagtaa gtcactagca 2857 
tcagaaatag tcattaatta ggaatcggtt tgtgttaatg ttatgcttag cgaaaatatt 2917 



acaatgctgt tgatatcact aaccatcacg taaccatatt gataaaatgt aaatacagaa 2977 
tattgcggtg tgtatttgta tataaatttt agaaaaaaaa aaaaaaaaaa aactcgagag 3037 
tacttctaga gcggccgcgg gcccatcgat tttccacccg ggtggggtac caggtaagtg 3097 
tacccaattc gc , loq 
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